投行人必須會用的數(shù)據(jù)處理工具,你知道幾個?
當實習中的你,被老板安排找到騰訊某股東占公司注冊資金的百分比數(shù)據(jù)。你卻一臉蒙圈不知道從何搜集數(shù)據(jù),硬著頭皮通宵整理完的數(shù)據(jù)又不知道如何快速整合,懷著忐忑的心情把Excel發(fā)出去,結(jié)果卻因數(shù)據(jù)不美觀被老板怒罵退回。
因為對數(shù)據(jù)一無所知的你
被老板翻過幾個白眼?
今天,數(shù)據(jù)君就來教你KO數(shù)據(jù)的三大妙招,刷新老板對你的認知
第一招:如何在3s內(nèi)獲取數(shù)據(jù)?一、搜集數(shù)據(jù)渠道
1.券商研究報告渠道
哪里才能獲得第一手投資研究報告?知名金融數(shù)據(jù)平臺像投行人必備的Bloomberg(彭博)和Factset是最常見的獲取數(shù)據(jù)的渠道。
Bloomberg
Bloomberg (彭博)是為大多數(shù)大型金融機構(gòu)提供服務,用戶通過“彭博專業(yè)服務”可以查閱和分析實時的金融市場數(shù)據(jù)以及進行金融交易。
彭博終端是一套讓專業(yè)人士訪問“彭博專業(yè)服務”(Bloomberg Professional Service)的計算機系統(tǒng)。
彭博終端基于客戶—服務器架構(gòu)建立,服務器是一個多處理器的Unix平臺,終端用戶使用的客戶端是一個Windows程序。
FactSet
FactSet研究系統(tǒng)是一家金融數(shù)據(jù)和軟件公司,為全球主要金融機構(gòu)的分析員、證券管理員和投資銀行家提供金融信息和分析軟件。
FactSet核心的優(yōu)勢主要集中在公司的財務數(shù)據(jù),這也是為什么它成為投行Anaylst必備技能之一的原因。
FactSet在投行中的使用頻率是Daily basis,而且FactSet個性化的界面,強大的功能,Excel plugin 也不差。
2.各大上市公司報告渠道
一些頂級咨詢公司如德勤、IBM、貝恩等都會發(fā)布annual report以及公司近況通常具有時效性,能系統(tǒng)地反映公司現(xiàn)狀,從而輔助投資的策略判斷。
3.上市公司公告渠道
主要包括美國SEC、香港披露易、中國巨潮咨詢查詢上市公司,對于高凈值個體或大型投資有輔助分析作用。
4.投行網(wǎng)站渠道
主要包括IPO、junling(巨靈)等渠道,多為華爾街咨詢、香港股票行情、金融建模及演示,可獲取各大投行現(xiàn)下投資組合分析及行情。
5.銀行業(yè)網(wǎng)站渠道
主要包括World Bank(世界銀行)、Forst(福斯特) 等各大知名銀行平臺渠道,可獲得實時銀行咨詢以及公告、數(shù)據(jù)的查找。
6.數(shù)據(jù)庫渠道
主要包括IEEE Xplore、EBSCO等,包含宏觀數(shù)據(jù)、金融、教育、行業(yè)數(shù)據(jù)等,并擁有完備的年度數(shù)據(jù)。
7.國外國家or經(jīng)濟體數(shù)據(jù)渠道
其中包括美國(提供了有關美國當前經(jīng)濟形勢的描述和主要宏觀經(jīng)濟變量數(shù)據(jù))和經(jīng)濟合作與發(fā)展組織數(shù)據(jù)(提供了成員國的金融數(shù)據(jù),但也包括一些總體數(shù)據(jù),比如GDP、失業(yè)和通貨膨脹等)。如Heston-Summers數(shù)據(jù)庫、《當代商業(yè)縱覽》等。
8.綜合性數(shù)據(jù)渠道
各類財經(jīng)、股票、經(jīng)濟類數(shù)據(jù)庫,如產(chǎn)品價格指數(shù)(PPI)詳細報告,國際股票市場數(shù)據(jù)庫,聯(lián)合國統(tǒng)計年鑒等等,提供宏觀經(jīng)濟信息、行業(yè)(產(chǎn)業(yè))發(fā)展報告、企業(yè)(公司)信息、產(chǎn)品市場分析,大量表格和統(tǒng)計數(shù)據(jù),以及很多相關站點的鏈接,內(nèi)容從收入、財富到貧困問題都有。
9.策略常用網(wǎng)站渠道
國內(nèi)常用財政部、發(fā)改委等官方網(wǎng)站來了解政府政策及實時咨詢,分析當前社會及資本浮動情況;國外常用BEA、CBO等了解股票、財政等等詳細數(shù)據(jù)和實時分析。
10.搜索引擎渠道
主要包括谷歌、BASE、sciseek等搜索引擎,多用于查找、搜索資源,能準確定位你想要的數(shù)據(jù)。
二、使用程序語言自動抓取網(wǎng)絡數(shù)據(jù)在數(shù)據(jù)獲取領域中,最為被廣泛使用的就是python語言,俗稱爬蟲。
通過爬蟲加正則這種自動化的工具,能夠耗很少的人工就可以將數(shù)據(jù)和信息采集并結(jié)構(gòu)化,后續(xù)通過更多的分析工具完成許多有商業(yè)價值的分析并獲取所謂的insight(將信息轉(zhuǎn)化為知識和洞察)。
推薦使用網(wǎng)站:regex101.com
示例:爬取社交網(wǎng)絡數(shù)據(jù):Facebook
Facebook提供了API,可以提交關鍵字等信息爬取搜索結(jié)果中的每一條內(nèi)容。
第二招:如何清理數(shù)據(jù)?1.萬能的Excel
Excel是迄今為止最簡單最便捷的處理數(shù)據(jù)方式。下至四則運算,上至各類統(tǒng)計分析、矩陣運算及線性規(guī)劃都可以搞定。但是想在投行借excel玩出花樣,千萬不要以為會了VLookup及一些快捷鍵就可以耀武揚威了,至少需要把矩陣乘法、向量乘法、Offset/ Cells/ Row/ Range等函數(shù)用到極致,這樣大多數(shù)Financial Model會做得非常靈活,而且各種數(shù)據(jù)查詢及匹配工作會達到部分SQL的處理水平。
2.進階版Excel:VBA
VBA會讓Office的能力提升一個檔次,除了完成函數(shù)不能完成的一些任務,最有價值的是能夠在Office的各套軟件之間實現(xiàn)信息同步。
學習Excel VBA較為正規(guī)的圖書是 John Green的 Excel 2007 VBA Programmer’s Reference,中文版由Excel Home翻譯為《Excel 2007 VBA參考大全》。這本書應至少閱讀完前7章。閱讀完前4章即可以嘗試解決工作中遇到的問題了。
第三招:如何完美地呈現(xiàn)數(shù)據(jù)當數(shù)據(jù)清理完畢后,如果你直接呈現(xiàn)給Boss,那就糟了!你知道美化前后的數(shù)據(jù)的差別有多大?
前者是一個落魄的流浪漢,后者成了一個精英,雖然還是同一個人,但明顯視覺感受迥然不同。而且最重要的是美化后的表格能帶來80%的溝通效力。
如何美化數(shù)據(jù)?數(shù)據(jù)可視化,了解一下,它主要是借助于圖形化手段,清晰有效地傳達與溝通信息。
數(shù)據(jù)可視化技術包含以下幾個基本概念:
①數(shù)據(jù)空間:是由n維屬性和m個元素組成的數(shù)據(jù)集所構(gòu)成的多維信息空間;
②數(shù)據(jù)開發(fā):是指利用一定的算法和工具對數(shù)據(jù)進行定量的推演和計算;
③數(shù)據(jù)分析:指對多維數(shù)據(jù)進行切片、塊、旋轉(zhuǎn)等動作剖析數(shù)據(jù),從而能多角度多側(cè)面觀察數(shù)據(jù);
④數(shù)據(jù)可視化:是指將大型數(shù)據(jù)集中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程。
數(shù)據(jù)可視化主要用于以下兩方面:
①報表類,如JReport,Excel,F(xiàn)ineReport,ActiveReports報表等。
②BI分析工具,如Style Intelligence、BO,BIEE,帆軟FineBI等。
③國內(nèi)的數(shù)據(jù)可視化工具,有BDP商業(yè)數(shù)據(jù)平臺-個人版,大數(shù)據(jù)魔鏡,數(shù)據(jù)觀,F(xiàn)ineBI商業(yè)智能軟件等。
1.Excel
Excel的圖形功能并不強大,但Excel是分析數(shù)據(jù)的理想工具。
作為入門級工具,Excel是快速分析數(shù)據(jù)的理想工具,也能創(chuàng)建供內(nèi)部使用的數(shù)據(jù)圖,但是Excel在顏色、線條和樣式上可選擇的范圍有限,這也意味著用Excel很難制作出能符合專業(yè)出版物和網(wǎng)站需要的數(shù)據(jù)圖。
但是作為一個高效的內(nèi)部溝通工具,Excel應當是你百寶箱中必備的工具之一。
2.Chart.js
JsChart組件功能強大,能適應各種復雜的需求和業(yè)務,而且操作起來相對簡單。
3.Google Chart API
Google Chart API工具中取消了靜態(tài)圖片功能,目前只提供動態(tài)圖表工具。但Google Chart的一個大問題是:圖表在客戶端生成,這意味著那些不支持JavaScript的設備將無法使用,此外也無法離線使用。
當然,Google chart API還是很強大的,在線自動幫你將所需要的數(shù)據(jù)匯總成,各式各樣的圖標,折線 餅狀 柱狀 氣泡等等。
4.Echarts
Echarts是一款開源、功能強大的數(shù)據(jù)可視化產(chǎn)品??梢粤鲿车倪\行在 PC 和移動設備上,兼容當前絕大部分瀏覽器(IE8/9/10/11,Chrome,F(xiàn)irefox,Safari等),底層依賴輕量級的矢量圖形庫 ZRender,提供直觀,交互豐富,可高度個性化定制的數(shù)據(jù)可視化圖表。
5.D3
D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫。但是D3能夠提供大量線形圖和條形圖之外的復雜圖表樣式,例如Voronoi圖、樹形圖、圓形集群和單詞云等。D3想要入門不是太簡單,至少都要有HTML和JavaScript基礎才行,對JavaScript的DOM要求也有點高。
6.Crossfilter
Crossfilter 是一個 JavaScript 類庫,能夠在瀏覽器端對大量數(shù)據(jù)進行多維分析。Crossfilter既是圖表,又是互動圖形用戶界面的小程序,當你調(diào)整一個圖表中的輸入范圍時,其他關聯(lián)圖表的數(shù)據(jù)也會隨之改變。它可以在不同的 Group By 查詢之間實現(xiàn)“交叉過濾”,自動連接和更新查詢結(jié)果。
7.R語言
R語言是主要用于統(tǒng)計分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個自由、免費、源代碼開放的軟件,它是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具。它可以運行于UNIX,Windows和Macintosh的操作系統(tǒng)上,而且嵌入了一個非常方便實用的幫助系統(tǒng)。
8.jsDraw2DX
用于創(chuàng)建任何類型的交互式圖形 SVG (舊 IE 瀏覽器是 VML ) 的一個獨立 JavaScript 庫。除了生成所有基本形狀像線、 矩形、 多邊形、 圓、 橢圓、 圓弧等,庫包可以繪制曲線、 貝塞爾曲線 (任何 degree )、 函數(shù)圖形、 圖像和文本的裝飾。
9.Visual.ly
如果你需要制作一個快速的視覺圖像,你沒有必要再詢問專業(yè)的設計團隊,你可以自己完成這些工作。Visual.ly就是最流行的一個選擇。其中提供了大量信息圖模板。
查找數(shù)據(jù)、處理數(shù)據(jù)、美化數(shù)據(jù)的工具都在這了
你平時用過哪幾種呢?
學會其中一兩種
分分鐘KO各種數(shù)據(jù)
還怕不能升值加薪?