大數據中的野味:誰最偏愛蝙蝠們?
此刻,一定會有不少人後悔當初吃了那些野味。肺炎疫情的爆發,牽動著每一個人的心。當鐘南山院士在接受采訪時表示,新型冠狀病毒的來源很大可能是竹鼠、獾一類的野生動物時,舉國上下嘩然一片。感慨此次疫情與17年前的非典如出一轍的同時,沉寂已久的野味問題又再度公之於眾,並站上了輿論的風口浪尖。
雖說“民以食為天”,但絕非所有的食物都適合人類。事實上,我們的祖先經歷了幾千幾萬年的反复篩選與淘汰,早已留下了一份包括雞、鴨、魚、牛、羊、豬等動物在內的寶貴食譜,這些也正是最適合後來人吃的食材。
然而,總有一些“不走尋常路”的人,出於獵奇、虛榮等心理和“滋補養生 ”的意願而盯上了野生動物,從蛇、果子狸、鱷魚到野豬、穿山甲、貓頭鷹,甭管是天上飛的、地上爬的、還是水里遊的、土裡鑽的,統統都想吃進肚子裡——縱然這些野味攜帶一身致命病毒,哪怕營養價值和口感並不佔優,但那些盯上它們的人依然我行我素,而“病從口入”的四字箴言,也被悉數拋諸腦後。
隨著新型冠狀病毒的不斷擴散,對於野味問題的聲討之勢也在水漲船高。可是SARS的前車之鑑告訴我們,若想真正讓野味問題得到解決,光靠呼籲抵制斷然是不夠的,還有很多謎題需要破解。比如,究竟是哪些地方的哪些人更“鍾情”於野味?搞清楚這一問題,我們才能更加了解國內野味市場的模樣,進而有的放矢地將應對措施落到實處。
這也是本文想要嘗試去回答的問題。
一、大數據下的野味市場畫像
有道是“沒有調查,就沒有發言權”,想要描繪出我國野味市場的樣貌,一番調研自然是不可缺少。
不過,並非只有挨家挨戶實地走訪才算得上是調研。眼下已是大數據時代,隨著互聯網技術的蓬勃發展,人們身處的世界早已被網絡上呈爆炸式增長的海量信息所充斥,基於各種搜索引擎、社交媒體、新聞客戶端與電商平台,廣大用戶不僅能從互聯網上獲取所需要的信息,還在不經意間將自己所思所想的痕跡都以數據的形式留在了上面。
而這也使得人們漸漸具備了物理和數據的雙重屬性,想要認識某一個人或某一群人,可能完全不必“面基”,只需讀懂大數據平台所反映出的信息即可達到目的。就像流行於互聯網圈的那句老話所言:
“很多互聯網平台,可能比你自己還要了解你。”
沿著這一思路,我們不妨借助百度搜索大數據平台來對各地的野味現像做個探究。
根據百度指數“野味”的近30天“需求圖譜”選項顯示,果子狸、蝙蝠、竹鼠、獾、穿山甲、麂子等動物排名靠前;從“人群畫像”選項中又可以看到,對野味關注程度最高的省份TOP10分別為廣東、山東、江蘇、浙江、河北、四川、河南、北京、福建和上海,而城市TOP10則分別為北京、上海、廣州、成都、深圳、杭州、武漢、重慶、天津和青島。這些結果與人們一貫的認知也大體吻合。
然而必須指出的是,近30天剛好是武漢肺炎從發現病例到大面積蔓延的關鍵時間段,其間人們對於野味的關注,也多半是受疫情發展態勢所影響,不能充分佐證各地居民對於野味的“鍾情”。
因此,我們將時間範圍調整至2019年12月以前,如此便可剔除疫情這個“黑天鵝事件”的影響,更為客觀真實地反映問題。
為了能清晰直觀地呈現結論,可以從三個維度展開分析。
(1)到底是不是一直有人在吃野味?
在有數據記錄的2011年1月至2019年12月期間,受禽流感等事件影響,“野味”的百度搜索指數出現過幾次脈衝,不過總體上一直處於不低的水平,日均搜索次數也相對較高。另外,“野味的做法”和“野味館”的百度搜索指數同樣呈現出較為明顯的季節性波動。
這便在一定程度上說明,儘管經歷了2003年非典的風波,可依然有不少人對於“吃野味”這件事有著濃厚的興趣。
(2)不同省份都“中意”什麼野味?
考慮到“野味”一詞過於籠統,不能直接反映動物種類,我們可以通過更多關鍵詞的搜索來發現問題。數據表明,2013年7月~2019年12月,比較受追捧的五類野味分別為蝙蝠、果子狸、竹鼠、穿山甲和麂子,對它們熱情最高的十個省市為廣東、江蘇、山東、浙江、北京、河南、河北、四川、上海和福建。
不同省市的人,偏好也有所差異。例如,廣東關注度最高的是穿山甲和竹鼠,其次是果子狸和蝙蝠;江蘇、山東、北京、河南與河北關注度較高的是穿山甲和蝙蝠;浙江和上海對於穿山甲、竹鼠和蝙蝠較為關注;而四川和福建則格外關注竹鼠和穿山甲。
(3)哪些城市的人最愛吃野味?
基於對“野味的做法”、“野味大全”和“野味批發”三個關鍵詞的搜索可以看到,2013年7月~2019年12月,最關注這些話題的10個城市分別為重慶、成都、武漢、長沙、北京、廣州、杭州、深圳、上海與合肥,而這些城市也可視為“最愛吃野味”的典型代表。
值得一提的是,對於“野味的做法”一詞,關注度最高的五個城市均不在廣東省,大概顛覆了不少人對於廣東這個著名野味大省的印象;而此次疫情的中心城市武漢高居第三,更是耐人尋味。
針對武漢做進一步考察,可以看到的是,前文五類野味的百度指數曲線走勢皆不“太平”,其中穿山甲出現過10次以上的搜索高峰,而竹鼠、果子狸、蝙蝠和麂子同樣經歷過幾次熱度高漲,這也能在一定程度上印證“武漢居民鍾情於野味”的結論。
至此,我國野味市場的大致輪廓便勾勒完畢。
二、搜索大數據的價值日漸凸顯
基於上述種種,我們除了看到國內野味市場的模樣之外,還應該看到大數據與搜索大數據的價值所在。
先來講一個故事:
2500多年前,古希臘數學家泰勒斯來到埃及,有人請教他如何能測量出金字塔的高度——在當時,還沒有人能回答這一問題。泰勒斯思考後說道:“你站在金字塔前面,隨時測量陽光下你影子長度的變化,當影子的長度和你的身高一樣時,你立刻去測量金字塔影子的長度,那就是它的高度。”
今天看來,這只不過是一個簡單的正比例關係,但在當時卻是一道極為高深的數學題。
同樣的道理,前文的整個分析過程看似簡單,但若放到2003年的非典時期,這絕對是一項不小的工程,勢必要對全國范圍內多個地區進行實地走訪調研,並通過發放問卷、採集信息、整理數據、抽樣估計等一系列分析手段來得出自己想要的結論,必要時甚至還要採用構建數理模型的方法,不僅過程繁瑣複雜,而且要投入大量的時間、精力和金錢,其結果也未必會完全貼近現實。
今時不同往日。17年後的今天,大數據技術正在改變著人們分析經濟社會問題與解決商業難題的基本範式。由於互聯網的成熟,經濟統計不再是數據指標的唯一來源,基於互聯網技術產生的搜索數據、社交媒體數據、在線新聞、交易支付數據以及快遞服務數據等等,都可用於分析。
同時,數據指標的生成也不再完全依賴傳統的抽樣調查和經濟普查,各個搜索引擎、社交媒體、電子商務等平台上,都可以實時生成不同的數據指標,而這些龐大的數據體量,恰恰就是現實的直接反映。
誠如維克托·邁爾·舍恩伯格在《大數據時代》一書中所概括的大數據“4V”特徵——Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值) 。
搜索大數據,更是開創了大數據分析在實戰中的先河。在美國,有Google開發的谷歌趨勢(Google Trends)數據產品,在中國,則是以百度等為代表的搜索大數據平台在起作用——前文的野味市場分析,便是得益於此。
究其原因,作為一個便民的工具,百度、谷歌等搜索引擎的使用,完全是用戶主動發起的需求,其本身就具有明確的指向性,數億網民的每一次搜索行為,都是一次數據行為或者數據樣本的貢獻過程,而數十億次搜索帶來的數據沉澱,充分體現出“Volume(大量)”、“Variety(多樣)”的特點。
就像此次肺炎疫情引發人們對於“野味”的關注,促使大量用戶湧向信息平台,通過搜索工具來滿足自己對信息和知識的訴求,同時也留下了相應的數據信息,這一短期、高密集的大量的用戶行為,以及數據的即時生成與信息的聚合,表現為“Velocity(高速)”。最後,通過搜索大數據來探求用戶“鍾情”度的趨勢並得出結論,體現“Value(價值)”。
這是搜索大數據對“4V”特徵的極佳詮釋,也是我們這個時代的寶貴財富。
三、除了分析當下,還能預判未來
更進一步講,搜索大數據的價值不僅僅是分析當下,更在於預判未來。
典型案例便是2008年,Google公司在美國啟動了“谷歌流感趨勢(GFT)”項目,把5000萬條美國人最頻繁檢索的詞條和美國CDC(疾控中心)在2003~2008年季節性流感傳播時期的數據進行了比較,並採用特殊的數學模型分析處理後,得到了與官方數據吻合度高達97%的預測結果。
更令人稱奇的是,Google成功預測了2009年H1N1流感病毒在全美範圍的傳播,不僅早於美國CDC的報告,甚至還具體到了特定的地區和州,為公共衛生機構提供了有效及時的數據信息。
由於種種原因,Google後來的預測並不是每次都能做到百分百精確,可是仍然讓世人看到了搜索大數據的魅力,並為眾多現實問題的解決提供了新的思路。
如果以“事後諸葛亮”的心態來复盤此次疫情,那麼武漢會出現新型冠狀病毒這件事情,有沒有可能早就被大數據預判到了呢?
我們來回顧前面的一張圖:根據百度指數搜索結果,2013年7月~2019年12月,在全國約300個直轄市和地級市當中,武漢對於關鍵詞“野味的做法”的關注度竟高居第三,很大程度上反映出,當地居民在疫情爆發之前,就已長期熱衷於吃野味了。
然而,野味完全不同於人們日常食用的家禽、家畜等肉類產品,它們都是經過衛生防疫部門嚴格檢疫後才投放至市場的;而“來路不明”的野味,卻總是潛藏著種種危機,尤其是攜帶著諸多人畜共患的傳染病病毒。
根據東北林業大學教授、動物疾病專家華育平介紹,靈長類、囓齒類、兔形目、有蹄類、鳥類等多種野生動物與人的共患性疾病有100多種,包括狂犬病、結核、B病毒、鼠疫、炭疽、甲肝等;河南農業大學教授、B病毒專家田克恭也指出,我國的獼猴有10%~60%都攜帶B病毒,這樣的猴把人撓上一下、甚至只是吐上一口,都有可能致人感染,而生吃猴腦感染的機率則更大。
“鍾情”於吃野味的武漢,實際上正是長期處於感染病毒的“高危預警”狀態。
我想,此刻除了援助武漢之外,我們更應該提高警惕,因為搜索大數據已經暗示我們,長期處於“高危預警”狀態的城市,可能還有很多個。
四、尾聲
所幸的是,一些可喜的變化正在發生。
除了“野味”之外,肺炎疫情引發大眾廣泛關注的話題還有“保護野生動物”。從百度指數中“保護野生動物”關鍵詞的搜索結果可以看出,自1月20日起,曲線走勢開始顯著上升,不僅一再創下近半年來的新高,而且並沒有顯露出下滑跡象;分省來看,最近30天內對“保護野生動物”最為關注的省份,前八名分別為山東、廣東、江蘇、河北、浙江、河南、北京和四川,而這八個省份,恰恰又都位列於此前“對各種野味熱情最高的10個省份”這一陣營裡。
根據前谷歌大數據科學家賽斯·斯蒂芬斯-大衛德維茨的研究結果,人類行為的網絡數據,包括搜索引擎、購物網站、社交媒體甚至黃色網站的相關數據,都能透露出大眾的真實想法,因為在具體調查與填寫問卷的過程中,很多人會因為覺得尷尬而隱瞞事實,而當網民們毫無戒備、獨自一人在電腦前打開搜索引擎時,更容易敞開心扉,進而將內心的真實想法與感受留在網絡上。
按此邏輯,百度指數搜索結果,很大程度上可以反映出國人對於保護野生動物意識的覺醒以及觀念的轉變——尤其是那些曾經熱衷於吃野味的地區。
這無疑是值得我們欣慰的。
拒絕野味的意義,不僅在於你我他的身體健康與生命安全,更在於為保護生態平衡與大自然的和諧盡一份力。要知道,人類與動植物一起構成了大自然的有機整體,任何生物之間都有著物質變換和能量轉化的鏈索關係。若是因人類的“管不住嘴”與利益熏心而導致野生動物走向瀕危甚至滅絕,那麼一旦“生態鏈”遭到破壞,後果將不堪設想。
誠如著名建築歷史學家梁思成之子梁從誡先生的告誡:
“自然界的生態平衡猶如一張大網,每個物種都是網上的一道經緯,任何一個物種的滅絕都會使這個大網上出現孔洞,任何一個孔洞對人類來說都是絕對危險的。”
相信這絕不是我們任何人希望看到的景象。
眼下又是一個難能可貴的契機,我們真的不應該再次錯過它。