基于SVM和多特征融合的滬銅期貨價(jià)格預(yù)測分析論文
基于SVM和多特征融合的滬銅期貨價(jià)格預(yù)測分析論文
期貨(Futures)與現(xiàn)貨完全不同,現(xiàn)貨是實(shí)實(shí)在在可以交易的貨(商品),期貨主要不是貨,而是以某種大眾產(chǎn)品如棉花、大豆、石油等及金融資產(chǎn)如股票、債券等為標(biāo)的標(biāo)準(zhǔn)化可交易合約。因此,這個(gè)標(biāo)的物可以是某種商品(例如黃金、原油、農(nóng)產(chǎn)品),也可以是金融工具。以下是學(xué)習(xí)啦小編今天為大家精心準(zhǔn)備的:基于SVM和多特征融合的滬銅期貨價(jià)格預(yù)測分析相關(guān)論文。內(nèi)容僅供參考閱讀,希望大家能夠喜歡。
基于SVM和多特征融合的滬銅期貨價(jià)格預(yù)測分析全文如下:
一、研究背景和目的
銅是人類最早發(fā)現(xiàn)的金屬之一,被廣泛應(yīng)用到電氣電子工業(yè)、機(jī)械制造、化學(xué)工業(yè)、建筑工業(yè)、醫(yī)學(xué)和國防工業(yè)等。在中國,銅在有色金屬材料的消費(fèi)量近次于鋁。隨著我國經(jīng)濟(jì)快速穩(wěn)步發(fā)展,已成為全球銅消費(fèi)最大的國家。我國作為銅資源相對短缺國家,每年需進(jìn)口大量銅礦。但由于銅市的價(jià)格波動(dòng),對消費(fèi)者、生產(chǎn)與經(jīng)營者的利益造成了重大影響。因此,通過研究銅期貨價(jià)格規(guī)律,可以一定程度上規(guī)避價(jià)格風(fēng)險(xiǎn),穩(wěn)定經(jīng)濟(jì)健康發(fā)展。
本文研究的內(nèi)容是基于SVM統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法,融合宏觀經(jīng)濟(jì)因素、銅現(xiàn)貨、LME銅期貨價(jià)格和美元匯率來研究上海銅期貨價(jià)格預(yù)測。
二、相關(guān)工作介紹
目前國內(nèi)學(xué)者對于滬銅期貨價(jià)格研究關(guān)注于兩個(gè)方面:一是研究國外期銅和上海期銅價(jià)格的相關(guān)關(guān)系;二是研究上海銅現(xiàn)貨價(jià)格與上海期銅價(jià)格的相關(guān)關(guān)系。
蔣序標(biāo)[1]研究倫敦金屬交易所(LME)和上海期貨交易所(SHFE)期貨銅的價(jià)格引導(dǎo)關(guān)系。其結(jié)論為倫敦銅期貨價(jià)格只單向滯后引導(dǎo)滬銅期貨價(jià)格, 滬銅期貨對于倫敦銅期貨價(jià)格無滯后價(jià)格引導(dǎo)關(guān)系。芮執(zhí)多[2]將SHFE、LME和紐約商業(yè)交易所(COMEX)中銅期貨價(jià)格聯(lián)動(dòng)關(guān)系做了動(dòng)態(tài)分析。其結(jié)論為LME的銅期貨定價(jià)能力最強(qiáng),而SHFE也具有了一定的國際影響力。
田新民[3]通過協(xié)整方法及因果關(guān)系分析研究滬銅與倫銅的價(jià)格引導(dǎo)關(guān)系,得出倫敦金融交易所銅期貨價(jià)格對于上海期貨交易所的銅期貨價(jià)格具有主導(dǎo)作用的結(jié)論。同時(shí),SHFE的銅期貨價(jià)格的影響力也在增強(qiáng)。劉勃[4]通過協(xié)整與向量自回歸方法,研究倫敦金屬交易所期銅、上海期貨交易所期銅和上海銅現(xiàn)貨價(jià)格之間的關(guān)系。
實(shí)證顯示,上述三者因素具有長期均衡關(guān)系,并且倫敦期銅價(jià)格具有主導(dǎo)價(jià)格發(fā)現(xiàn)作用。趙亮[5]通過Granger協(xié)整分析,得出滬銅期貨與倫敦銅期貨價(jià)格具有協(xié)整關(guān)系,并且滬銅期貨價(jià)格對于倫敦銅期貨價(jià)格具有一定的影響作用。王淑嫻[6]通過分析倫敦銅期貨價(jià)格、上海鋁期貨價(jià)格、燃油期貨價(jià)格和江西銅業(yè)股票價(jià)格,得出滬銅價(jià)格的主要影響因素是倫敦銅期貨價(jià)格的結(jié)論。方燕[7]通過對滬銅期貨價(jià)格與現(xiàn)貨價(jià)格的實(shí)證分析,得出滬銅期貨價(jià)格與現(xiàn)貨價(jià)格在長期與短期具有不同的影響系數(shù)。顧浩[8]通過實(shí)證方法,分析得出滬銅期貨與現(xiàn)貨價(jià)格存在協(xié)整關(guān)系,并研究了存在協(xié)整關(guān)系的原因。
三、本文工作介紹
本文通過SVM統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法,融合宏觀經(jīng)濟(jì)因素(包括居民消費(fèi)者價(jià)格指數(shù)(CPI)、工業(yè)品出產(chǎn)價(jià)格指數(shù)(PPI)、采購經(jīng)理人指數(shù)(PMI)、城鎮(zhèn)固定資產(chǎn)投資、工業(yè)增加值增長、貨幣供應(yīng)量、海關(guān)進(jìn)出口增減情況、全國股票交易統(tǒng)計(jì)和新增信貸數(shù)據(jù))、銅現(xiàn)貨價(jià)格、LME銅期貨價(jià)格和美元匯率多特征因素,分析預(yù)測上海銅期貨價(jià)格變動(dòng)。
數(shù)據(jù)采用上海期貨交易所銅期貨合約cu1402在2013年2月19日至2013年12月30日的交易數(shù)據(jù),其包括每日的開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、結(jié)算價(jià)、成交量、成交金額等。銅現(xiàn)貨價(jià)格采用同期上海期貨交易所滬銅連續(xù)交易數(shù)據(jù),其包括每日開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)和成交量。
宏觀經(jīng)濟(jì)因素采用同期數(shù)據(jù)包括居民消費(fèi)者價(jià)格指數(shù)(全國、城鎮(zhèn)、農(nóng)村的當(dāng)月、同比增長、環(huán)比增長和累計(jì)增長)、工業(yè)品出產(chǎn)價(jià)格指數(shù)(當(dāng)月、當(dāng)月同比增長和累計(jì))、采購經(jīng)理人指數(shù)(制造業(yè)、非制造業(yè)的指數(shù)、同比增長)、城鎮(zhèn)固定資產(chǎn)投資(當(dāng)月、同比增長、環(huán)比增長、自年初累計(jì))、工業(yè)增加值增長(同比增長和累計(jì)增長)、貨幣供應(yīng)量(流通中的現(xiàn)金M0、貨幣M1、貨幣和準(zhǔn)貨幣M2的數(shù)量、同比增長和環(huán)比增長)、海關(guān)進(jìn)出口增減情況一覽表(當(dāng)月出口、當(dāng)月進(jìn)口、累計(jì)出口和累計(jì)進(jìn)口的金額、同比增長和環(huán)比增長)、全國股票交易(上海、深圳的發(fā)行總股本、市價(jià)總值、成交金額、成交量、A股最高綜合股指指數(shù)和A股最低綜合股價(jià)指數(shù))和新增信貸數(shù)據(jù)(當(dāng)月、同比增長、環(huán)比增長和累計(jì))。
LME銅期貨數(shù)據(jù)采用同期數(shù)據(jù)包括當(dāng)日的開盤價(jià)、收盤價(jià)、最高價(jià)、最低價(jià)和成交量。美元匯率采用同期數(shù)據(jù)包括當(dāng)日的收盤價(jià)、開盤價(jià)、最高價(jià)、最低價(jià)和百分比變化。模型輸入數(shù)據(jù)包括以上特征,輸出數(shù)據(jù)為預(yù)測下一日的開盤價(jià)、最高價(jià)、最低價(jià)和收盤價(jià)。
支持向量機(jī)(support vector machines,SVM)是一種二類分類模型。其基本模型是定義在特征空間上的間隔最大的線性分類器。因此,支持向量機(jī)的學(xué)習(xí)策略就是間隔最大化,可看作是一個(gè)求解凸二次規(guī)劃的問題。支持向量機(jī)包括線性可分支持向量機(jī)、線性支持向量機(jī)和非線性支持向量機(jī)。
本文采用非線性支持向量機(jī),使用核技巧和軟間隔最大化來學(xué)習(xí)模型。其中,核函數(shù)在當(dāng)輸入空間為歐式空間、特征空間為希爾伯特空間時(shí),表示從輸入空間映射到特征空間得到的特征向量間的內(nèi)積。因此,通過使用核函數(shù)將輸入空間中的非線性分類問題轉(zhuǎn)換為在高維特征空間學(xué)習(xí)線性分類問題。
四、模型結(jié)果
采用SVM方法訓(xùn)練測試模型,其中輸入的多特征包括當(dāng)日滬期銅合約cu1402數(shù)據(jù)、宏觀經(jīng)濟(jì)數(shù)據(jù)、銅現(xiàn)貨價(jià)格、LME銅期貨價(jià)格和美元匯率,預(yù)測下一天滬期銅合約cu1402的開盤價(jià)、最高價(jià)、最低價(jià)和收盤價(jià)。
從預(yù)測結(jié)果可以看出,在向前預(yù)測25天之內(nèi)的滬銅價(jià)格時(shí),累計(jì)平均誤差最小,在500元~600元之間。以25天為分界線,預(yù)測超過25天滬銅價(jià)格時(shí),隨著時(shí)間推移累計(jì)平均誤差不斷變大。其原因有兩點(diǎn):一是時(shí)間推移,各種條件已發(fā)生變化,因此訓(xùn)練的模型的預(yù)測有效降低;二是銅期貨合約后期成交量變化和成交金額會(huì)變化較大,由于滬期銅在后期之后交易波動(dòng)變大,訓(xùn)練模型的有效性較低。
也得知預(yù)測25天內(nèi),價(jià)格累計(jì)平均誤差隨著時(shí)間推移,不斷減小。其原因是在較小一段時(shí)間內(nèi),隨著時(shí)間推移,輸入的特征因素對于未來期銅的價(jià)格的累計(jì)誤差減小。從開盤價(jià)、收盤價(jià)、最高價(jià)和最低價(jià)預(yù)測上看,都存在一個(gè)大約向前25天左右的累計(jì)平均誤差最小。因此,此模型在使用時(shí),可基于未來25天預(yù)測情況進(jìn)行投資,實(shí)現(xiàn)累計(jì)平均誤差最小,也即風(fēng)險(xiǎn)最小。
五、輸入特征重要性分析
利用logistic回歸方法,分析影響開盤價(jià)、最高價(jià)、最低價(jià)和收盤價(jià)預(yù)測準(zhǔn)確度的輸入特征。
重要的輸入特征為滬銅期貨歷史每日開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、結(jié)算價(jià)、漲跌1(收盤價(jià)-前一日結(jié)算價(jià))、漲跌2(結(jié)算價(jià)-前一日結(jié)算價(jià))、成交量、成交金額和持倉量,居民消費(fèi)者價(jià)格指數(shù),工業(yè)品出廠價(jià)格指數(shù)的當(dāng)月和當(dāng)月同比增長,采購經(jīng)理人指數(shù),城鎮(zhèn)固定資產(chǎn)投資同比增長,貨幣供應(yīng)量M2的同比增長,深圳股票交易所發(fā)行總股本和成交量,上海交易所最高和最低的綜合股價(jià)指數(shù),當(dāng)月新增信貸數(shù)據(jù),滬銅現(xiàn)貨歷史每日收盤價(jià)、開盤價(jià)、最高價(jià)和最低價(jià),LME銅期貨歷史每日收盤價(jià)、開盤價(jià)、最高價(jià)、最低價(jià)和成交量,美元匯率的歷史每日收盤價(jià)、開盤價(jià)、最高價(jià)和百分比變化。
六、下一步工作
需要進(jìn)一步降低價(jià)格預(yù)測的誤差,一方面可以選擇更多輸入特征,另一方面使用更有效的算法。另外,可以考慮如何將此模型融入到實(shí)際交易策略中,來輔助交易判斷。(作者單位:對外經(jīng)濟(jì)貿(mào)易大學(xué)金融學(xué)院)