中文在线免费视频,欧美亚洲桃花综合,日本中文字幕在线视频站,欧美精品一区二区三区观

中國投資者情緒指數簡(jiǎn)介

發(fā)布日期:2018-06-29 02:56    來(lái)源:北京大學(xué)國家發(fā)展研究院

中國投資者情緒指數簡(jiǎn)介

2018年6月

  1. 什么是中國投資者情緒指數?

中國投資者情緒指數(China Investors’ Sentiment Index, CISI)是在收集網(wǎng)絡(luò )能反應投資者情緒的上億條金融文本大數據的基礎上,使用深度學(xué)習方法,度量文本信息反映的中國投資者情緒。它一方面刻畫(huà)了2008年以來(lái)金融市場(chǎng)中投資者的情緒變遷,另一方面能夠實(shí)時(shí)追蹤當下投資者的情緒變化。

  1. 為什么需要投資者情緒指數?

“黑天鵝”、“灰犀牛”類(lèi)事件的頻發(fā),對于理解和預測市場(chǎng)狀況提出了新的要求。除了采用度量經(jīng)濟和市場(chǎng)基本面的常見(jiàn)“硬”指標外,監管部門(mén)和政策制定者、投資者、企業(yè)、金融機構和學(xué)界亟需能夠反映金融市場(chǎng)當下以及未來(lái)波動(dòng)的情緒類(lèi)“軟”指標。但是,現有中國投資者情緒指數或采用有限問(wèn)卷收集信息、或頻率低、地域窄、缺乏延續性、或包含了情緒之外的其他信息,無(wú)法滿(mǎn)足需求。

學(xué)術(shù)研究中對于投資者情緒(Investors’ Sentiment)的定義主要有兩類(lèi):(1)噪聲交易者關(guān)于股票未來(lái)股價(jià)預期偏離理性套利者信念的程度(De Long等, 1990)。(2)投資者基于對資產(chǎn)未來(lái)現金流和投資風(fēng)險的預期而形成的一種信念(Baker和Wurgler,2006)。

國外對于投資者情緒指標的選取主要包括以下三類(lèi):(1)客觀(guān)指標。包括:封閉式基金折價(jià),IPO發(fā)行量及首日收益,交易量,共同基金凈贖回,股票發(fā)行與債券發(fā)行比例等。(2)主觀(guān)指標。包括:個(gè)體投資者協(xié)會(huì )指數,投資者智能指數,證券分析師情緒指數,消費者信心指數。(3)復合指標。采用主成分分析法,將客觀(guān)指標和主觀(guān)指標等結合在一起。

國內現有關(guān)于投資者情緒的研究,參考國外投資者情緒指數構建方法為主。指標的選取類(lèi)似于國外主觀(guān)、客觀(guān)指標,并結合國內實(shí)際情況做適當調整。各機構也編制了若干指數,以主觀(guān)指標為主,包括:央視看盤(pán)指數,巨潮投資者信心指數,好淡指數,上海投資者信心指數。

但以上指標均存在一定的缺陷。基于交易行為的指標,是市場(chǎng)多種力量下的均衡結果,不止反映投資者情緒。主觀(guān)指標雖然能夠反映受訪(fǎng)者填寫(xiě)問(wèn)卷時(shí)的情緒,但不能全面反映投資者在投資過(guò)程中的情緒。此外,多數機構編制的指數存續期短,甚至不再更新。隨著(zhù)互聯(lián)網(wǎng)和深度學(xué)習的發(fā)展,基于文本大數據的投資者情緒日益受到重視,但采用文本大數據全面度量投資者情緒的市場(chǎng)需求尚未滿(mǎn)足。

  1. 中國投資者情緒指數新在何處?
  1. 團隊新。研究團隊由高校學(xué)者(北大國家發(fā)展研究院、杜克大學(xué)教授,北大國家發(fā)展研究院碩博研究生)和大數據分析公司百分點(diǎn)聯(lián)袂組成,有谷歌高級工程師作為算法顧問(wèn)。
  2. 數據新:全網(wǎng)收集A股所有上市公司相關(guān)文本數據。
  1. 體系新:全面度量與刻畫(huà)中國投資者情緒。所有上市公司;頻率:日頻、月頻、年度、可到小時(shí);分板塊、分行業(yè)、甚至公司級。
  2. 方法新:人類(lèi)智慧與深度學(xué)習相結合,采用支持向量機、卷積神經(jīng)網(wǎng)絡(luò )等方法計算投資者情緒。
  3. 產(chǎn)品新:一部中國金融情緒辭典;一套涉及各板塊、各行業(yè)、不同頻率的指數。
  1. 中國投資者情緒指數構建方法
  1. 全網(wǎng)收集關(guān)于全部上市公司的投資者情緒相關(guān)的文本大數據。時(shí)間上從2008年7月開(kāi)始,截止至2018年5月已收集約1億5千萬(wàn)條文本信息。
  2. 利用中文分詞技術(shù)對文本進(jìn)行分詞處理。
  3. 利用Word2Vec技術(shù),將文本中的詞語(yǔ)向量化。
  4. 對于國外的LM詞典(Loughran和McDonald, 2011)運用翻譯工具進(jìn)行翻譯和檢查,構建中文版的LM詞典。
  5. 在滬深300成分股中,選取200只股票,并對每只股票選取200條討論帖子。由北京大學(xué)國家發(fā)展研究院教授、優(yōu)秀博士和碩士生、市場(chǎng)投資者組成人工標注團隊,對這4萬(wàn)條帖子進(jìn)行人工標注。兩人獨立標注一條文本信息,根據其內容將其分為正、負、不確定三類(lèi),同時(shí)對每條帖子列出其包含的正、負關(guān)鍵詞。標注完成后,保留標注分類(lèi)一致的帖子,根據標注結果構建中國金融情緒詞典(GB),并獲得中國金融市場(chǎng)投資者情緒標注集。
  6. 運用多種文本情緒算法檢驗穩健性。算法選擇包括傳統的詞典法和機器學(xué)習方法。對于詞典法,詞典選取兩部:中文版本的LM詞典,專(zhuān)業(yè)標準團隊構建的中國金融情緒詞典(GB)。對每個(gè)帖子,統計帖子中正面和負面詞語(yǔ)的數量,分別采用等權重法(Equal-Weighted, EW)和詞頻-逆文檔法(Term Frequency-Inverse Document Frequency, TF-IDF)計算帖子的情緒得分。對于機器學(xué)習方法,分別采用支持向量分類(lèi)(Support Vector Classification, SVC)和卷積神經(jīng)網(wǎng)絡(luò )方法(Convolutional Neural Network, CNN)。在SVC方法下,結合兩類(lèi)詞向量表示法,第一類(lèi)為獨熱表示(One-Hot),第二類(lèi)為詞向量表示(Word2Vec)。
  7. 對于詞典法,直接計算其在測試集上(樣本外)的分類(lèi)準確性。對于深度學(xué)習法,先在標注集上訓練模型,并根據驗證集上表現最好的結果來(lái)確定模型的參數,選出最優(yōu)模型。比較各種模型在測試集上的分類(lèi)準確性。其中,詞典法的總預測準確率約為75.65%,SVC+Word2Vec的總預測準確率約為81.45%,CNN的總預測準確率約為81.24%
  8. 將訓練好的最優(yōu)模型應用到全部文本數據中,計算每個(gè)帖子的情緒得分。將不同股票帖子的情緒得分按照相應標準進(jìn)行加總,構建不同指標體系的投資者情緒指數。
  1. 中國投資者情緒指數指標體系

    中國投資者情緒指數包含一級指標(代表全部滬深股票的市場(chǎng)情緒指數),和按行業(yè)、按時(shí)間頻率和按板塊等分類(lèi)的二級子指數。其中按照行業(yè)分類(lèi)(參照Wind行業(yè)分類(lèi)標準和申萬(wàn)行業(yè)分類(lèi)標準),包含八個(gè)大類(lèi):金融行業(yè)、制造行業(yè)、服務(wù)行業(yè)、信息行業(yè)(計算機、傳媒、通信)、醫藥衛生行業(yè)、房地產(chǎn)行業(yè)、能源行業(yè)、消費行業(yè)。按照時(shí)間跨度分類(lèi),包含:月度頻率、周度頻率、日度頻率(全天情緒、隔夜情緒、午間情緒)以及日內半小時(shí)情緒。按照板塊劃分,包含:滬深300、上證50、中證500、中小板、創(chuàng )業(yè)板情緒指數。

  1. 中國投資者情緒指數包含了什么信息?

(1)CISI包含了投資者對市場(chǎng)已發(fā)生狀況的情緒反映(如:收益率、交易量、國際市場(chǎng)的表現)。投資者情緒指數和金融市場(chǎng)重大事件相吻合,如:2015年6月爆發(fā)股災,此后股市開(kāi)始大跌,而投資者情緒指數在7、9月分別處于歷史(2008.07-2018.05)次低點(diǎn)和最低點(diǎn)。(2)CISI還包含投資者對市場(chǎng)未來(lái)信息的預期。實(shí)證研究發(fā)現,該指數對市場(chǎng)收益率、波動(dòng)、交易量均具有一定預測能力。(3)不同時(shí)間段的投資者情緒表現出不同的特征。交易時(shí)間段的平均投資者情緒顯著(zhù)低于非交易時(shí)間段(隔夜情緒)的平均投資者情緒。(4)不同行業(yè)的投資者情緒在過(guò)去十年也具有不同的特征。在過(guò)去十年,醫藥行業(yè)的平均情緒最高,能源行業(yè)的平均情緒最低,消費行業(yè)的情緒波動(dòng)最小,金融行業(yè)的情緒波動(dòng)最大。

  1. 中國投資者情緒指數有什么用?
  1. 作為度量投資者情緒的工具, CISI不僅包含過(guò)去市場(chǎng)信息,也能在一定程度上反映投資意愿或投資者對市場(chǎng)走勢的預期。
  2. 對市場(chǎng)收益率、波動(dòng)、交易量均具有一定預測能力。
  3. 為政策制定部門(mén)和監管部門(mén)判斷市場(chǎng)走勢提供新的視角。
  4. 為學(xué)界理解市場(chǎng)運行規律提供的新抓手。
  5. 企業(yè)經(jīng)營(yíng)活動(dòng)、金融機構存貸款決策、資產(chǎn)管理的新參考。
  1. 團隊成員

沈艷,北京大學(xué)國家發(fā)展研究院經(jīng)濟學(xué)教授

李嘉,杜克大學(xué)經(jīng)濟學(xué)副教授,頂級金融計量期刊編審人

黃卓,北京大學(xué)國家發(fā)展研究院經(jīng)濟學(xué)副教授

杜曉夢(mèng),百分點(diǎn)首席數據科學(xué)家

黃偉,百分點(diǎn)研發(fā)總監

陳赟,北京大學(xué)國家發(fā)展研究院博士生

王靖一,北京大學(xué)國家發(fā)展研究院博士生

尤思宇,谷歌高級工程師(深度學(xué)習算法顧問(wèn))

北京大學(xué)國家發(fā)展研究院碩、博研究生、經(jīng)濟學(xué)雙學(xué)位本科生、校外研究生也參與了相關(guān)工作。

分享到: