從兩個(gè)數據看微博活躍度
活躍用戶(hù)數是衡量互聯(lián)網(wǎng)公司價(jià)值很重要的標準之一。微博在這幾年的發(fā)展中,其活躍度一直是數據研究機構的研究對象,最近香港大學(xué)公布了一份關(guān)于微博用戶(hù)數據的報告,這份報告對微博注冊用戶(hù)判定以及后續媒體的解讀與我們通過(guò)微博官方授權接口抓取的數據有比較大的差異。根據我們的數據,這份報告至少存在兩處嚴重的缺陷:
首先,微博自從2年前就不公布注冊用戶(hù)數,因為注冊用戶(hù)中存在僵尸和垃圾用戶(hù),雖然我們也不能拿到全部信息,但是根據我們獲得的授權數據測算,微博的總注冊用戶(hù)早已超過(guò)10億,其中新浪凍結的垃圾粉就有幾億(新浪凍結垃圾用戶(hù),但是并不刪除賬號),港大教授用的連續用戶(hù)ID遍歷的抓站方式,會(huì )導致抓到的很多是新浪已經(jīng)凍結(不能登錄,不能發(fā)言)的賬號,但官方數據接口會(huì )告知我們這些合作伙伴用戶(hù)屬性(是真實(shí)用戶(hù),還是凍結用戶(hù),還是實(shí)名用戶(hù))——也就是只有官方合作伙伴,才知道哪些用戶(hù)是有價(jià)值值得分析的用戶(hù)哪些不是,也才能進(jìn)行更科學(xué)的數據分析。
其次,香港大學(xué)那份報告公布的原創(chuàng )和轉發(fā)用戶(hù)的比例是1:20,這個(gè)數據明顯失準。根據我們從官方數據接口獲得的數據統計,原創(chuàng )和轉發(fā)的比例在不同月份會(huì )有所不同,但過(guò)去半年內從來(lái)沒(méi)有低于1:3。
之所以得出不準確的結論,是因為通過(guò)抓站獲取的數據本身就有問(wèn)題,首先這些抓站用戶(hù)不排垃圾,另外更重要的一點(diǎn),為了防止抓取核心用戶(hù)數據,對于識別的第三方抓站行為,站方會(huì )送一些混淆數據出去。因此港大很有可能是他們通過(guò)抓站方式獲取的數據中,獲取的數據從一開(kāi)始就是不精確的。
通過(guò)對微博官方授權數據接口獲得的數據進(jìn)行分析,針對以上兩個(gè)數據得出了以下結論。
每月發(fā)布微博用戶(hù)人數約在4500萬(wàn)---5500萬(wàn)。2014年3月我們監測到的數據中,在月活躍用戶(hù)中發(fā)布原創(chuàng )微博的用戶(hù)比例在35--40%左右,以此折算大約在4500萬(wàn)--5500萬(wàn)用戶(hù)每月發(fā)布過(guò)原創(chuàng )微博。社交平臺的用戶(hù)行為通常都遵循“二八定律”,即20%的人產(chǎn)生內容,80%的人閱讀、消費信息。即使是Twitter這樣的平臺,其大部分內容(75%)也是被5%的活躍用戶(hù)產(chǎn)生,從這個(gè)數據來(lái)看,微博的原創(chuàng )用戶(hù)比例要遠高于Twitter。3月微博的原創(chuàng )用戶(hù)占比明顯高于行業(yè)平均水平,這與馬航事件、文章出軌等熱點(diǎn)事件的刺激不無(wú)關(guān)系。
29%的原創(chuàng )用戶(hù)發(fā)布的微博被轉發(fā)、57%的原創(chuàng )用戶(hù)發(fā)布的微博被評論。文章發(fā)表聲明的單條微博互動(dòng)量超過(guò)400萬(wàn),大家覺(jué)得微博的互動(dòng)量是很高的,但是數據告訴我們并非如此。我們的監測結果表明,只有29%的原創(chuàng )用戶(hù)發(fā)布的微博被轉發(fā)、57%的原創(chuàng )用戶(hù)發(fā)布的微博被評論。與文章的聲明形成強烈一個(gè)強大的反差,這說(shuō)明微博傳播一直存在金字塔效應,大量的互動(dòng)都集中在“塔尖”的明星名人、意見(jiàn)領(lǐng)袖,數量巨大的“塔腰”和“塔基”用戶(hù)發(fā)布的微博,互動(dòng)量與“塔尖”用戶(hù)存在比較明顯的差距。這既是微博傳播的優(yōu)勢,同時(shí)也是問(wèn)題。要想進(jìn)一步提高微博的活躍度,需要為“塔腰”和“塔基”用戶(hù)帶來(lái)更高的互動(dòng)量,才能刺激他們發(fā)布高質(zhì)量的原創(chuàng )微博。
我們也注意到,微博也在做出一些改變,正在通過(guò)扶植中小V計劃對“塔腰”的用戶(hù)做出一系列的扶植計劃,同時(shí)推薦機制的形成也將對“塔基”部分的用戶(hù)在信息生產(chǎn)和傳播產(chǎn)生催化作用。針對這個(gè)話(huà)題,我們會(huì )過(guò)一段時(shí)間發(fā)布專(zhuān)門(mén)的研究報告。
作為微博官方的數據合作伙伴,一些第三方發(fā)布的微博用戶(hù)數據經(jīng)常會(huì )對我們的客戶(hù)甚至是整個(gè)行業(yè)造成困擾。如上所述,微博一直在對各種抓站行為進(jìn)行限制,甚至對識別出的抓站行為故意提供錯誤數據,以便保證數據的權威性并保護合作伙伴的利益。在國外,對網(wǎng)站的數據分析也需要首先與官方簽署合作協(xié)議,通過(guò)官方提供的數據接口獲取數據,我們看到的關(guān)于twitter、Facebook等社交網(wǎng)站的用戶(hù)數據信息,都是通過(guò)這種方式進(jìn)行研究得出的。