渴望大數據的Facebook

facebook

「大數據」(Big Data;或譯為巨量資料)是近幾年中常常被提及的詞彙,透過電腦對於資料的收集、歸類、分析,使得資料轉化為「資訊」。當我們使用「大數據」的概念時,其實也表達了資訊本身的質或量,無論與過去比較起來有多不同,社會都已經準備好一個自我描述的方式,而這也透露了,目前的社會無疑地與過去面對著完全不一樣的問題。

我們面對的,不再是資訊量有多大,有多麼爆炸性地增長,也不再是資訊呈現的形式或內容與過去有多大的差異,而是資訊開始以一種過度複雜且令人無法預測的方式連結起來,這種連結才使得資訊不斷生成新的意義,並且我們也總是選擇性地理解這些資訊,在不同觀察者轉換中,這些大數據也隨之改變它們的意義。做為一個社會現象,大數據所指涉的並不只是它在商業、科學、醫療、網路及各領域中的應用,而是更廣泛的在改變我們思考事物的方式。首次提出此概念的是麥爾荀伯格和庫基耶,在「大數據」一書中,他們認為巨量資料所帶來的助益,是提醒我們,資料的量變會導致質變,同時這也引發我們描述世界的方式跟著轉換。我們無需再堅持所謂的「因果關係」,而是應該強調資料之間的相關性。巨量資料讓觀察者能用一個較後設的方式描述世界,現在的問題只是,社會學提供了哪些概念工具讓我們能以不同的角度將巨量資料連結起來,藉此賦予巨量資料新的脈絡。

Facebook是目前累積巨量資料的機制之一,比起其他的擷取巨量資料的網站,特殊之處在於它首次將社會學中一直在談的「社會關係」視覺化了。而且,做為一個特殊的社會現象,我們開始可以利用數學和資訊的方式描述電腦、網路所帶來的新影響,我們無法再沿用傳統社會學中顯然不夠用的概念,例如用虛擬社群來描述Facebook中的使用者。Facebook中,使用者之間的關係不再是全然的複製真實生活中的人際關係,並將這些人際關係轉換到Facebook這個交流平台而已,如果我們願意接受,電腦和網路已經是媒介的這個前提,那麼Facebook就不再虛擬,而是大幅度開展了溝通的可能性空間,透過演算法的技術,資訊可以在使用者輸入之後,經過運算,又再度將運算結果反饋給使用者,這只需要非常短的時間就可以完成。我們之所以使用「虛擬」一詞,是為了與「實在」區分開來,但是,當我們再也無法隨時中斷使用Facebook,它脫離了僅是娛樂的作用,原因不在於我們除了在Facebook上玩小遊戲之外,還參與了許多社會議題的討論,而是因為它所採用的技術,不只是連結起真實實在和虛構實在(Luhmann, 2006:116-121),還讓每個在它之中發生的接觸都有連結起來的可能性,也許虛擬和實在這組區分就只能提供給那些「抗拒科技的基本教義派」(Baecker, 2013:170-171)使用了。另外,所謂的社群也無法再定義為是社會聯合,只有當有足夠的人群進行夠久的公開討論時才會出現。而且在討論中帶入個人情緒,這樣一來,虛擬空間中就出現了個人情感的緊密交織(Rheingold, 1993/1994:16),因為Facebook中的團體,只能被一個又一個的溝通論題聚集起來,而後消散,即便情感強度再高,當溝通論題無法再被延續下去時,Facebook上短暫時間裡被聚集起來的使用者又會再度分散開來,等待下一次被其他溝通論題聚集。這使得「社群」這個似乎指涉著有一群人聚集在特定空間中的概念,也不再適用於描述我們目前面對的狀況,因為Facebook上的使用者並不固定,重要的是哪些話題以及透過哪種特殊類型的演算法,才能讓我們看到這樣的使用者群,換句話說,是怎麼樣的脈絡才讓使用者呈現為使用者。當問題意識是如此,使用者就已經不再等同於人,因為使用者這個概念所能開展的脈絡已經比人更為廣泛,它包含著程式、演算法、甚至是程式設計人員等等的概念群,人不再是這些概念的統一。

big-data-150x150

Facebook上的按讚功能一方面讓使用者很容易就將彼此之間的關係化約為「對共同話題有同樣的意見」,另外一方面,使用者也清楚,在他們對特定話題表達贊同時,他們的個人資料、意見也能夠立刻引發其他使用者的注意力,並接著形成連結,持續引發後續的觀察。對觀察者來說,Facebook上收集使用者按讚的巨量資料,如果將資料以不同的方式分類,就能夠以不同的方式解讀資料,且得到不同的分析結果,更重要的是繼續開展其他分析資料的可能性,因為每當確認了一部分資料量的分析結果,就同時也標示出未被分析或解讀的資料,這些資料仍然具備了眾多可能性,即便是已經被分析過的資料,在其他脈絡下或是在不同觀察者的觀察中,也會產生不同的結果,建構出不同的資料秩序。例如,Facebook上的演算法可以從時間、性別等等來分類獲得的資料,同時再次拋棄這些類別,重新建立其他類別,意味著從別的角度來分析這些資料。在過去,這是科學研究者,特別是統計學者的工作,但在目前電腦和網路的時代,演算法就分擔了(或者激進一點可以說是取代)過去統計學者的工作。在統計學式的世界裡,資料是靜態的、收集了以後就不再更動,即便要更動也絕對是浩大工程,而Facebook上由演算法所執行的資料收集,其實是在每一刻,當使用者點下滑鼠按讚時,演算法就立刻進行運算,而這也使得Facebook上的數據庫每一刻都在變動和重整,根據觀察者的觀察偏好,又會再度使得巨量資料隨之更動(Baecker, 2013:183)。

巨量資料做為一個現象,對社會學來說值得思考之處在於,第一,它挑戰了過去社會學中不斷試著要確定下來的研究對象之間的因果關係,巨量資料彼此之間的連結和相關性所開展出來的空間和可能性,其實更適合於描述社會學中的各種現象所身處的脈絡,主要在於它保留了觀察的可能性,以及資料彼此之間能夠連結且再次鬆綁,研究對象不再穩定,而是隨時會經由任何一個接觸而改變,這是社會學立基於巨量資料能夠有所突破之處。第二,過去社會學中資料的分類與詮釋資料的判準,依賴著已經沉積下來的理論進路或是經驗研究的研究成果,但是現在透過演算法,可以直接由資料自身中生成特定的模式和類別,而且只需要電腦短暫快速的運算就可以達成。如Dirk Baecker所說,因此,我們需要後設資料(Metadaten),讓我們能從演算法的角度對巨量資料提出問題。而後設資料就如同理論、模式、描述和解釋一樣,也陳述了一個對於秩序的猜想[…]我們就將後設資料視為一個觀察者的設置和觀察,他因此能為其他觀察者生產出其他的資料(Baecker, 2013:160-162,183)。

Baecker在談論巨量資料的現象時,引入了後設資料的概念,以便我們能夠以不同的方式和脈絡將巨量資料連結起來。而後設資料包含了複雜性、溝通、系統、演化、網絡概念、合作、群(Schwarm)、行動(Handlung)、形式和後設資料自身。在社會學中,或許後設資料的概念提供我們另外一個角度來理解巨量資料,巨量資料重要之處不在於應用在各個不同領域中,也並非用來預測趨勢,而是它與後設資料這個概念群的連結,同時它也挑戰了社會學中對於電腦和網路的理解,不再僅是將這兩者化約為技術,電腦和網路做為媒介,確實地挑戰了傳統的社會結構,改變我們的思考方式,以及對這個世界的描述方式。從巨量資料的概念化,我們就可以清楚的認識到,它為社會學注入的新能量。即便Baecker對於巨量資料是否能作為自我組織,如同社會、大腦、意識等,仍感到質疑(Baecker, 2013:168),但無疑地,巨量資料的出現的確挑戰並擴張了傳統社會學的視野,研究者應該怎麼確立下自身的研究對象,當它本身就處於非靜態時,我們究竟能如何進行研究?社會學或許早已經準備好區分理論和形式理論來面對這個問題。

 

(作者:蕭煒馨 / weihsinhsiao@gmail.com
德國Witten/Herdecke大學文化反思學院社會系博士候選人)


 

參考書目

Baecker, Dirk (2013): Metadaten, in: Big Data. Das neue Versprechen der Allwissenheit, 1. Auflage. Berlin: Suhrkamp.

Rheingold, Howard (1993/1994), Virtuelle Gemeinschaft: Soziale Beziehungen im Zeitalter des Computers (Dagmar Schulz and Dieter Strehle, Trans.). Bonn: Addison-Wesley.

Luhmann, Niklas,胡育祥、陳逸淳合譯 (2006),《大眾媒體的實在》(Die Realität der Massenmedien),台北:左岸。

Mayer-Schönberger,Viktor/ Cukier, Kenneth,林俊宏譯 (2013),《大數據》(Big Data: A Revolution that will transform how we live, work and think),台北:遠見天下文化。

 

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s