為您提供各行業(yè)互聯(lián)網(wǎng)私人定制開(kāi)發(fā)解決方案
爬蟲(chóng)基金:比CEO還先知道上市公司數(shù)據(jù)
全球股票市場(chǎng)正在演化為一個(gè)數(shù)據(jù)戰(zhàn)場(chǎng)。
如我們所知,在股票市場(chǎng)中,誰(shuí)有數(shù)據(jù)信息優(yōu)勢(shì),誰(shuí)就具備收獲超額收益的可能。
問(wèn)題是,該如何提前獲得數(shù)據(jù)呢?恐怕多數(shù)人首先想到的是內(nèi)幕信息。
殊不知,通過(guò)對(duì)公開(kāi)數(shù)據(jù)的收集和加工,并應(yīng)用于投資,也是可以獲得這種優(yōu)勢(shì)的。
迄今,在以華爾街為中心的全球股票市場(chǎng)中,機(jī)構(gòu)投資者通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取領(lǐng)先數(shù)據(jù),進(jìn)而贏得收益戰(zhàn)爭(zhēng)的現(xiàn)象已越來(lái)越普遍。
就中國(guó)市場(chǎng)而言,通過(guò)藥師的走訪調(diào)研得知,中國(guó)私募機(jī)構(gòu)們運(yùn)用爬蟲(chóng)技術(shù)的現(xiàn)象亦正日趨增多。其中主力,則多為那些此前率先涉事量化交易的私募機(jī)構(gòu)們。
這類爬蟲(chóng)私募是如何運(yùn)作的,藥師這就為你揭示。
爬蟲(chóng):我只是信息的搬運(yùn)工
所謂爬蟲(chóng),是一種能自動(dòng)獲取網(wǎng)頁(yè)內(nèi)容,并可以按照指定規(guī)則提取相應(yīng)內(nèi)容的程序。
用大白話來(lái)說(shuō),爬蟲(chóng)就是一個(gè)探測(cè)機(jī)器,它的基本操作就是模擬人的行為去各個(gè)網(wǎng)站溜達(dá),點(diǎn)點(diǎn)按鈕,查查數(shù)據(jù),把看到的信息背回來(lái)。
作為一種常用的收集數(shù)據(jù)手段,爬蟲(chóng)往往會(huì)被數(shù)據(jù)采集公司,用來(lái)搜索出現(xiàn)在公共網(wǎng)站、社交媒體、在線社區(qū)、郵件插件上可能有價(jià)值的信息。
例如從應(yīng)用程序和用戶評(píng)論的下載,到航空公司和酒店通過(guò)票務(wù)網(wǎng)站接收預(yù)訂的信息。
爬蟲(chóng)可以跟蹤很多東西,從雜貨到汽車銷售的價(jià)格趨勢(shì)。
分析師可以通過(guò)抓取消費(fèi)者網(wǎng)站上產(chǎn)品的評(píng)論,來(lái)評(píng)估新產(chǎn)品的推出和產(chǎn)品生命周期。
下圖展示的一家數(shù)據(jù)公司,不僅提供多家在美上市公司的領(lǐng)先數(shù)據(jù),還提供相關(guān)的投資分析服務(wù)。
包括特斯拉(NASDAQ:TSLA)的庫(kù)存數(shù)據(jù),以及各社交網(wǎng)絡(luò)上和用戶的交互數(shù)據(jù)。
以及,不久前在香港上市的小米(HK:01810)的社交網(wǎng)站的數(shù)據(jù)。
當(dāng)然,這是免費(fèi)版的界面,相信付費(fèi)版中提供的內(nèi)容會(huì)更加豐富。
下面這家數(shù)據(jù)分析公司,更是覆蓋多家已經(jīng)上市的中概股,其中就包括剛剛登陸美股的拼多多(NASDAQ:PDD)的數(shù)據(jù)。
在一位匿名業(yè)內(nèi)人士看來(lái):“對(duì)于爬蟲(chóng)技術(shù)而言,難點(diǎn)主要在于反抓取上,被爬取方可能會(huì)針對(duì)IP、頻次、請(qǐng)求習(xí)慣等方面做一些分析和限制,也會(huì)有圖形驗(yàn)證碼等人機(jī)驗(yàn)證手段防止爬取?!?/p>
他進(jìn)一步表示:“其次的難點(diǎn)就不是爬蟲(chóng)的問(wèn)題了,而在于龐大數(shù)據(jù)的分析和清洗上,怎么從看似雜亂的數(shù)據(jù)中分析出自己想要的內(nèi)容,也是很需要技術(shù)含量的。”
比CEO更了解企業(yè)運(yùn)營(yíng)狀況
作為國(guó)內(nèi)較早將爬蟲(chóng)技術(shù)應(yīng)用于投資領(lǐng)域的保銀投資,近年來(lái)的投資可謂穩(wěn)扎穩(wěn)打,收益方面也是節(jié)節(jié)攀升。
究竟是如何做到上述這些的?基金經(jīng)理李墨給出了答案。
“為了有效緊密跟蹤交易性機(jī)會(huì),充分尋找上市公司各類蛛絲馬跡,目的是做到比CEO更了解財(cái)務(wù)狀況,也比CFO更了解運(yùn)營(yíng)情況。首先要做的,就是設(shè)置互聯(lián)網(wǎng)爬蟲(chóng)系統(tǒng)緊密各類數(shù)據(jù)和信息?!北cy投資基金經(jīng)理李墨表示。
具體來(lái)看,觀察產(chǎn)品價(jià)格背后的供需情況,以酒店為例,經(jīng)濟(jì)型酒店房?jī)r(jià)處于動(dòng)態(tài)變化,經(jīng)營(yíng)者根據(jù)入住情況不斷調(diào)整價(jià)格。因此,可以從線上預(yù)定網(wǎng)站或線下渠道,了解客源情況,并做進(jìn)一步微觀信息挖掘,深度了解運(yùn)營(yíng)能力。
通過(guò)類似這樣的數(shù)據(jù)分析,就容易找到行業(yè)內(nèi)公司間的差異性,通過(guò)運(yùn)用股票多空策略,就可以實(shí)現(xiàn)較為穩(wěn)健的獲利。
“比如說(shuō)做多招行(SH:600036)做空農(nóng)行(SH:601288),那么只要招行比農(nóng)行跌的少,我就能賺錢(qián)。招行比工行農(nóng)行漲得多也賺錢(qián),招行比農(nóng)行好這件事情大概率是比較確定的?!北cy投資副總裁馬肸珣表示。
類似的例子,還有做多吉利汽車(HK:00175),做空長(zhǎng)城汽車(HK:02333)。
超額收益的來(lái)源:政策和情緒
“對(duì)于具有典型政策市特征的中國(guó)股市而言,通過(guò)對(duì)官媒信息的有效分析,有助于判斷國(guó)家政策變化?!蹦沉炕侥既耸客嘎丁?/p>
“以計(jì)劃生育政策為例,通過(guò)對(duì)獨(dú)生子女政策關(guān)鍵詞在官媒上出現(xiàn)頻率的跟蹤,有助于預(yù)測(cè)政策變化。”上述人士進(jìn)一步表示。
“另外,個(gè)人投資者情緒的準(zhǔn)確捕捉,對(duì)投資中國(guó)A股市場(chǎng)也至關(guān)重要。對(duì)社交媒體的有效分析,是獲得中國(guó)A股超額收益的關(guān)鍵,因?yàn)閭€(gè)人投資者占據(jù)了A股市場(chǎng)很大一部分的交易量。”上述人士透露。
他進(jìn)一步表示:“我們每月都會(huì)通過(guò)爬蟲(chóng)抓取超過(guò)200萬(wàn)篇的股評(píng)文章,從‘股吧’中每天讀取約10萬(wàn)個(gè)帖子信息,用于觀察個(gè)人投資者情緒。發(fā)現(xiàn)個(gè)人投資者在網(wǎng)絡(luò)上所發(fā)布的相關(guān)股票信息,可用于對(duì)相關(guān)股票未來(lái)收益的預(yù)測(cè)?!?/p>
“具體來(lái)看,高度活躍的股票信息交流,通常預(yù)示著相反的市場(chǎng)走勢(shì);持續(xù)一致的積極觀點(diǎn),預(yù)示著潛在的市場(chǎng)高預(yù)期表現(xiàn)?!鄙鲜隽炕侥既耸拷忉尩?。
爬蟲(chóng):私募超額收益的下一個(gè)來(lái)源
華爾街對(duì)于超額收益的追求從來(lái)沒(méi)有停下過(guò)腳步,在過(guò)去的150年中,超額收益的來(lái)源平均每10至20年就要變化一次。
在20世紀(jì)50年代,最初的對(duì)沖基金發(fā)明了股票多空策略;
在20世紀(jì)80年代,數(shù)學(xué)和計(jì)算機(jī)比手持式計(jì)算器更具優(yōu)勢(shì);
在21世紀(jì)初,超額收益來(lái)源于高頻交易。
這些策略或工具,一度讓那些能夠首先使用它們的人比其他人更有優(yōu)勢(shì)。
但隨著它們變得越來(lái)越普遍,它們的優(yōu)勢(shì)消失了,投資者不得不尋找新的策略工具。
目前看來(lái),“爬蟲(chóng)”當(dāng)?shù)赖慕裉欤褂媚切┯珊A繑?shù)據(jù)掩蓋下的獨(dú)特、領(lǐng)先信息,或?qū)⒊蔀樗侥汲~收益的下一個(gè)來(lái)源。