手機版 | 簡體版 | 發布廣告 |常用工具 | 網站地圖

登錄註冊找回密碼切換風格

我要發布

倍可親首頁 › 日誌 › 長白山 › 日誌

長白山

https://big5.backchina.com/?98078

哈佛報告：中國網路審查制度如何允許批評政府卻禁止群體煽動 ...

作者：長白山於 2013-10-25 00:59 發表於最熱鬧的華人社交網路--貝殼村

通用分類:熱點雜談|已有1評論

加里哈佛大學肯尼迪政治學院教授

珍妮弗·潘哈佛大學肯尼迪政治學院博士生

瑪格麗特·羅伯茨哈佛大學肯尼迪政治學院博士生

【按】本文原載於《美國政治學評論》（American Political Science Review）2013年5月刊，題為《中國網路審查制度如何允許批評政府卻禁言群體煽動》（How Censorship in China Allows Government Criticism but Silences Collective Expression），作者為哈佛大學教授金加里（Gary King）和他的學生珍妮弗·潘（Jennifer Pan）與瑪格麗特·E·羅伯茨（Margaret E. Roberts）。該論文刊出后不久，觀察者網即組織翻譯。

金加里教授等通過對中國網路審查制度的大規模、多來源數據分析，得出結論：中國的領導層允許社交媒體發展，允許對政府、政策、領導人的批評。中國人在個體上是自由的，但在群體活動上是受控制的。這其實與我們看到的世界各國政府處理同樣問題時採納的方法基本相似，比較近的例子是英國卡梅倫政府對付社交媒體與騷亂的做法。

哈佛大學的教授等級中，最高級別是「校級教授」（University Professor），全哈佛大學目前一共只有24名。而政治學系金加里（Gary King）的「阿爾伯特•韋瑟黑德三世校級教授」（Albert J. Weatherhead III University Professorship）頭銜正是從大名鼎鼎的美國政治學者、前哈佛大學政治學系教授亨廷頓（Samuel Huntington）身上傳承而來。

雖然作者功力紮實，又具有重要的學術地位，但由於種種原因，與《外交政策》雜誌上此前刊登的《謠言共和國》相比，該論文在中美學術圈和媒體上引起的反響則顯得遲緩。《紐約時報》中文網專欄作家歐陽斌近期在哈佛大學就該論文對金加里教授進行了採訪。《環球時報》今日則刊發觀察者網專欄作家、復旦大學國際政治系講師沈逸文章《客觀研究中國網路，摘下有色眼鏡》，評述了該論文在學術圈內的窘境。

觀察者網今日特刊出金加里教授領導撰寫的此文譯文（附錄部分有刪節），供讀者借鑒：

中國網路審查制度如何允許批評政府卻禁止群體煽動

How Censorship in China Allows Government Criticism but Silences
Collective Expression

譯者：朱新偉、王楊

我們對可能是有史以來最廣泛的對人類言論的選擇性審查效果進行了首個大規模、多來源的分析。為此我們設計了一套系統，趕在中國政府發現、評估並審查（從網際網路刪除）他們視為不妥的內容之前，從1400個不同的社交媒體網站上定位、下載並分析數百萬的帖子。利用現代電腦文本分析方法，我們分別將85個主題範圍中，在一段時間內被審查的帖子與沒有被審查的帖子的實質內容進行了對比。跟之前的理解不同，那些對國家、領導人和政策進行消極甚至刻薄批評的帖子遭審查的可能性並不高。但是我們發現審查工程旨在限制群體性事件，對代表、加強或刺激社會動員的言論，不論是什麼內容一概禁言。審查的目標是預先阻止當前或未來可能發生的群體性事件，而且，它也明確暴露了政府的這一意圖。

介紹

中國政府有選擇地審查中國人民言論的項目，其規模和複雜程度在世界歷史上是沒有先例的。美國的社交媒體集中在少數的網站上，而中國則分佈於數以百計的地方站點上。審查的很大一部分責任下放給了這些網站內容提供者，如果他們違反政府審查守則，就有可能遭罰款或關停。為了遵守政府規則，每個網站都雇傭了最高達1000名審查員。此外，來自中央、省級和地方等不同級別的約2萬-5萬網警和網管辦（員工）以及約25萬-30萬「五毛黨」都參與了這項艱巨工程。中國的新聞自由規模在197個國家中與緬甸並列第187位（據2012年自由之家報告），但是中國的審查工作是迄今最大的。

在本文中我們發現，這一旨在限制中國人言論自由的機制，卻自相矛盾地包含了異常豐富的信息資源，暴露了中國政府利益、意圖和目標——這是學術和政策研究團體一直關注的話題。這樣的信息可以不間斷地獲得，跟通常媒體零星報道的領導人的公開活動不同。我們用該新信息發展新的理論以解釋審查機制的總體目標，進而揭示中國領導層的一些最基本目標，這些目標至今備受猜疑，卻缺乏實證分析。該信息對於其他很多學術（和實用）用途也很有價值。

我們核心的理論發現是，與很多研究和評論相反，審查機制的目的不是壓迫對國家或共產黨批評的言論。確實，儘管審查廣泛存在於社交媒體，我們發現當中國人對政府或領導人提出尖刻批評時，他們的帖子被封殺的幾率並沒有上升。但是，我們發現審查的目的是降低群體行為的可能性。只要群體性運動確定或可能發生，他們就會及時刪除社交聯絡。我們闡明上述觀點並討論它們對中國政治和比較政治學的很多研究領域產生的深遠影響。

在以下章節中，我們先對中國審查制度提出兩種理論。接著我們介紹獨特的數據源以及收集數據過程中的挑戰。接下來，我們闡明分析的策略，給出結果，並總結。附錄包括編碼細節，我們的中文文本自動分析方法，並暗示了審查行為如何預示政府在網際網路之外的行動。

政府意圖以及審查目標

以前衡量政府意圖的指標 破譯中國領導人隱秘的意圖和目標曾是研究中國精英政治研究的焦點。西方學者採用克里姆林學或北京學（中國政策研究）作為其研究方略。隨著文化大革命和改革開放的到來，研究者可獲得越來越多的數據，而學者也將研究方向轉到信息更開放的領域。今天的中國研究總體上依賴於官方數據、民意調查、地方官員訪談以及官員和政府的公開活動。這些資源很適合回答其他重要的政治科學問題，但是對於衡量政府意圖，它們顯然是間接的、採樣過於稀疏且往往價值存疑。比如，官方數據公布的「群體性事件（mass incident）」的數量，可能顯示了政府利益的考量，但我們只有將真實數字和政府操作分開才能看到這一點。同樣，抽樣調查或許有用，但政府顯然對普通公民有所隱瞞，而且即使受訪者擁有研究者想要的信息，他們可能也不願透露。在直接訪談官員時，研究者不得不佔一卦來確認他們的知情人真正相信什麼。

衡量意圖就更加困難了，目前的方法提供的信息太少，因為中國政府不是鐵板一塊。其實，在很多情況下不同的政府部門、不同的領導或不同級別的政府工作目的千差萬別，甚至很難確定一個統一的意圖或動機，更別說衡量了。我們不能解決所有的問題，但是政府的審查行為中的偏好會透露更多信息，據此我們可能會更好地採用有用的衡量手段。

審查理論 我們試圖充實審查的工作方式以及網路如何拓展公共話語的空間的研究。我們首先建立一個基於實證研究的理論，解釋政府為什麼要審查以及他們想通過這樣龐大的機制達到什麼目的。當下學者的結論合理但寬泛，即中國政府審查是為了維持政權。而我們著重研究政府到底認為什麼事是要緊的，以及它採取了什麼行動實現目標。

為此，我們提出了兩個理論。這兩個理論各自反映了威脅中國政權的某個方面。首先是國家批評論，即假定中國領導層是為了鎮壓異見並約束指摘中國政府、政策或領導的言論。結果是讓看得到的公眾言論對掌權者更有利。很多對國家的批評都包括在該理論中，比如差勁的政府業績。

第二個理論是我們所說的潛在群體行為論，即審查目標是聯合起來集體表達意願的人，他們受政府之外的人的激勵，並有引發群體行為的可能。該觀點認為，群體表達——很多人在社交媒體上就同一問題交流——涉及真實的群體行為，比如抗議或容易引發群體行為的事件，很可能會被審查。有潛在群體行為的帖子是批評還是歌頌國家，還是不涉及國家，都與本理論無關。

「潛在群體行為」也可以用中國政府鮮明的立場來描述，即不受政府控制的群體表達無異於派系鬥爭，並最終會導致混亂和無序。比如，在共產黨建黨90周年前夕，新華社發表社論稱，西方式議會制民主將導致中國重蹈文革的動蕩史。同樣地，在2011年3月召開的第11屆全國人大四次會議上，全國人大常委會委員長吳邦國稱，鑒於中國的國情，中國將不會借鑒多黨輪流執政的體制。這樣做的目的，是為了避免中國「陷入內亂深淵」。中國觀察家們常會注意到，中國政府對維穩的重視和通過約束社會關係限制群體行為的願望。中國體制遭遇了大量的爭端和群體行為。清華大學社會學系教授孫立平稱，2010年，中國共發生了18000起群體性事件。而這些事件將不可避免地對政府處理問題的方式和觀念產生影響。因為頻繁遭遇群體行為，政府的行動和觀念也受到影響。中國政府認為，對橫向溝通加以約束是合法且有效的保護人民的手段。

現在的學者無法通過實證研究分析我們提供的兩種理論的不同。Marolt (2011) 寫道，當「或者批評政黨及其政策，或鼓動群體性政治運動」時，網上的帖子會被查封。MacKinnon (2012)稱在溫州高鐵相撞事件中，網際網路內容提供者受命「跟蹤並審查批判性的帖子。」Esarey和Xiao (2008) 發現中國博主採用諷刺手法批評政府，以避免遭到鎮壓。Esarey 和 Xiao (2011) 寫道，共產黨領導人最害怕「有影響力的網民聯合對政府施壓，要求其改變政策，」但他們認為這種施加的壓力就是對政府的批評。Shirk (2011)稱審查的目的是約束政治反對派的動員，但她的例子表明批評的觀點來自於那些被壓迫的人。

抗議這樣的群體行為經常被視為是專制政權的喪鐘。東德、東歐以及最近的中東抗議都導致了政權革命。很多中國學者都關注導致人們反抗的因素以及人們採取的策略。中國政府似乎要不計代價阻止抗議——而且確實，群體行為的多少是地方官員的考核標準之一。然而，最近的數個研究指出專制政權可能會期待並歡迎潛在的小規模抗議活動。因為了解並處理群眾的不滿會促進政權穩定。Chen (2012) 指出小規模、孤立的抗議是中國長期的傳統，也是政府所期待的。

結論概述

上述兩個假說可能都對，也可能一對一錯或者全錯。根據我們的證據，答案很簡單：國家批評論是錯誤的，潛在群體行為論是正確的。我們的數據表明，中國的審查機制允許對中國政府、官員和政策的廣泛批評。結果是，審查首要針對的是限制可能引發群體行為的信息傳播，不論這種表達是直接反對政府還是與政策有關，都會審查。如果網上發帖數量大增，且內容與可能引發群體行為（如地面抗議）的事件有關，那麼審查就會到來。此外，我們還考察了每個事件中的情緒，發現在這些事件中，政府對支持和批評的觀點一概刪除。這表明中國政府相信，壓制有可能引發群體行為的帖子比壓制批評對維持統治更加重要。

數據

我們收集大量具體信息時面臨巨大挑戰，中國政府不希望任何人看到這些信息，因此會竭盡全力阻止別人獲取。下面我們我們將討論審查的種類，數據收集過程，該研究的局限性，以及我們對數據做後續分析的方法。

審查的種類

中國審查社交媒體上人類表達至少有3種方式，最後一種使我們研究的重點。首先是「中國大（長城）防火牆，」該防火牆完全禁止某些網站在中國運營。大防火牆令很多國外的網際網路公司頭痛，也阻止了中國人通過這些網站與國外的人交流。但中國人可以用其他的網站，用相似的方式表達自己的觀點，對此防火牆就無能為力了。比如，臉書在中國被禁，但人人網是相似的替代品；同樣新浪微博也是人氣很旺的推特的克隆網站。

第二種方式是「關鍵詞屏蔽」，它防止用戶發布含有被禁的詞或短語的文本。這對限制言論自由作用有限，因為網民發現比自動程序聰明並不難。他們用類比，比喻，諷刺等方式逃避審查。漢語提供了多種新穎的方法，比如替換漢字，其意思與原意無關但讀音相似（同音字）或看上去相近（同形異義字）。比如目田，本意是「眼睛田野」，但被魔獸世界玩家用來代指自由。同音字方面，「hexie」這個音經常被寫成河蟹，意思是河裡的螃蟹，但它是代指和諧，即官方的「和諧社會」政策。

一旦跨過了前兩個障礙，文章就在網上發布了，審查者將閱讀並刪除那些不妥的文章。根據研究文獻、觀察家、與數個政府內部人士的談話以及對數據的審核，我們幾乎可以斷定，內容過濾很大程度上是人工完成的——審查者手動閱讀文章。自動程序似乎只是輔助。跟大防火牆和關鍵詞屏蔽不同，手動審查不會被文字遊戲糊弄。因此，這也是最後也是最費力的審查方式，也是本文的研究重點。

收集

我們先收集社交媒體上的博客，至少在審查到來前，作者可以完整的表達他們的思想。

在很多國家，如美國，幾乎全部博客都集中在少數幾個大網站上（臉書、谷歌博客、Tumblr等）；中國確實有新浪這樣的大網站，但還有很大一部分社交媒體資源分佈在無數的單個站點上，比如地方bbs論壇等。這種多元對數據的收集工作造成了邏輯上的挑戰。由於網址、軟體界面、地方審查官員、網路可靠性、訪問速度、使用條款各不相同，審查模式也不同，能對我們的數據收集造成潛在妨礙的方式也多種多樣。幸運的是，中國獨特的社交媒體結構也為研究各地對群體表達的監管提供了絕佳機會，因為大量的本地站點提供了豐富的信息，這比在美國還要便利。

數據收集面臨的最複雜的挑戰是，趕在中國政府閱讀並刪除不妥的內容之前，定位、訪問並下載相關內容。此外，對每個帖子進行頻繁重訪以確認刪除的時間。還要在中國很多地方收集數據同時不會影響到我們研究的審查機制，研究也不會遭到制止。

我們能完成的原因是數據手機系統高度自動化，而中國審查系統涉及人工操作。我們龐大的工程（由於明顯原因將不會在此詳述）在全世界很多地方運行，包括中國內地。

中國審查制度

最後，在2011年前半年，我們從1382個中國網站上定位、訪問並下載了社交媒體帖子。中國社交媒體結構最顯著的特就是它有極長的（冪律狀的）尾巴。圖1是各網站的樣本和中文標識（圖片a）以及代表該長尾的網帖數量餅狀圖（圖片b）。最大的網帖來源是新浪博客（佔總數的59%），百度嗨，華生論壇，四月論壇和天涯。但尾巴還在一直延伸。

社交媒體帖子涵蓋的話題範圍太廣，以致於企圖涵蓋一切的隨機取樣策略很難對單一的話題提供有價值的信息。因此，我們採取了分層隨機抽樣設計的方法。我們先選取了85個單獨的話題範圍，並按照假定的政治敏感性分為高（如艾未未）、中（如計劃生育）、低（如流行網游）三檔。通過回顧以前的研究、諮詢中國專家以及對當下事件進行研究，我們分別在這三檔中選取某些特定話題。附錄A是完整的清單。然後，對每個話題範圍（用關鍵詞區分），我們收集6個月時間內所有相關的社交媒體帖子。我們檢查每個話題範圍的帖子，刪除垃圾郵件，再用輔助閱讀工具對內容進行研究。(Crosas et al. 2012; Grimmer and King 2011)我們收集了3674698篇帖子，其中隨機選出127283篇進行進一步分析。（我們在其他時間段里重複這一過程，有時候會對某些話題範圍進行更深入的研究。總共收集並分析了11382221篇帖子。）所有這些來自中國站點的帖子都是用中文寫的，不包來自括香港和台灣的文章。我們先閱讀每篇文章的內容，將其置於某個話題範圍的時間軸上，並重複訪問源網站以確定其是否被審查。根據需要，我們將用其他特定的數據對該信息進行補充。

審查者們並不害羞，因為我們發現可以直接區分（有意的）審查和零星的斷電或短暫的超時錯誤。被審查的網頁包含這樣的字眼：「抱歉，指定的主題不存在或已被刪除或正在審核『，有時候也會有警警和察察的標誌。

儘管我們的方法比審查者快，但他們顯然也是高度專業的。為了說明這一點，我們隨機收集並分析了2011年9月27日上海地鐵相撞事件前後的網帖、2012年4月10日到12日薄熙來事件的網帖和有關谷開來的網帖。

中國網路審查制度

我們對上述三個話題範圍的帖子進行不間斷監控，一共監控了9天。（其他範圍的審查遵循同樣的基本方式）圖2表示的是被審查的帖子數的直方圖。在三個事件中，大多數的審查是發生在原文發布后的24小時之內，當然也有一小部分帖子是5天之後再被刪除。這是一種驚人的組織能力，它需要大規模的軍隊般的精確：不同政府級別、分管不同網際網路內容提供商的領導需要首先做出決斷（通過一致意見、直接命令或折中），決定什麼內容需要被審查；他們需要將該決定傳達給數十萬的個人；然後他們在大約24小時之內完成審查工作。正如埃德蒙（2012）指出，社交媒體上信息源的激增讓信息越來越難以控制，然而，中國政府竟然在全國範圍內克服了這一困難。鑒於很多人很難達成一致意見，而且文本解釋中實現高級別的編碼者信度通常會很困難（比如Hopkins and King 2010, Appendix B）政府對審查工作的努力是巨大而專業的。我們發現了一些證據，表明這一龐大蕪雜的官僚體制中存在不同意見，比如在不同級別的政府之間。但我們尚未對此進行細緻的研究。

局限性

如下所示，我們的方法很大程度上揭示了中國領導層的目標，但它缺少網站的自我審查以及在我們獲得內容之前進行的審查；它也沒有對大防火牆、關鍵詞屏蔽或搜索過濾的直接效果進行量化。我們也沒有研究肢體暴力的效果，如逮捕博主或進行威脅。儘管各級政府和官員會對審查什麼、何時審查進行干預，但我們的數據有時候並不能讓我們對這些信息源加以區分。

我們當然無法判斷這些局限性的後果，不過我們可以合理地推斷其中最重要的當屬肢體暴力、威脅以及由此導致的自我審查。儘管我們分析的社交媒體數據包含數百萬中國人的意見且涵蓋了機器廣泛的話題和演講行為，而我們無法觀察的更少的討論活動很可能是對中國政府利益最要緊（或最緊迫的）。

最後，過去對網際網路行為的研究是基於他們的測量方式跟「現實世界」行為有多接近；接著，網路行為佔據了人類生活很重要的位置，因此今天社交媒體上觀察到的思想本身就非常重要，不論它能否很好地衡量非網路自由和行為。但無論是哪種方式，我們難以拿出證據說明，我們對中國社交媒體的研究跟新聞自由或其他的人類表達有什麼關聯。

分析策略

總體上看，大約有13%的帖子被審查。如果將所有領域所有的帖子匯總起來，這一平均水平隨著時間的推移變化不大，但它會隨著帖子數量和審查力度的變化產生巨大變化。我們發現，潛在政治敏感性和審查之間的關聯性非常低：在低檔和中檔敏感度事件中，審查率基本一致（分別是16%和17%），僅僅比高檔敏感度事件（24%）低了一點。顯然還有一些事情。為了發現是什麼事，我們接下來討論我們的編碼規則、核心假設和中國政府可能的審查程序。

編碼規則

我們分5步進行編碼。首先，我們先將社交媒體帖子按分層隨即抽樣設置的關鍵詞，將其分為85個話題範圍。儘管我們做了大量的檢查（通過大量閱讀並藉助現代電腦輔助閱讀技術），確保其準確性，我們的話題範圍里難免（藉助任何機器或人工分類技術）存在一些歸類錯誤的帖子。我們採用了保守的方法，先做出結論，忽略這一錯誤的影響。隨後，我們進行了反覆的篩查（用同樣的技術），確保我們不會錯過任何重要的信息。這種歸類錯誤可以看做是系統性錯誤，但其中的每個事件都鞏固了我們的結論。

第二，眾所周知，幾乎所有話題範圍（和國家）的言論是「陣發」的，即穩定的時期常常被偶然爆發的有關某話題的數量激增打破。我們還發現僅僅有兩個例外——色情內容和對審查者的批評，如下所述——審查工作在數量爆發（volume burst）時期（即事件熱點時期）力度往往格外大。因此，我們對數量爆發期前後的數據進行了處理。我們將每個話題範圍都看做6個月時間序列中每天的數量，並採用文件回歸技術計算的權數偵測數量爆發，以確定在剩餘時間序列中的離群值（outlaying observations）。

通過這一過程，我們檢測到85個話題範圍中有67個出現數量爆發，一共出現了87次。

第三，我們將每個事件歸為一下五類：1.潛在群體性事件，2.對審查者批評，3.色情內容，4.政府政策，5.其他新聞。每個類別都可能包含批評或不批評政府、領導人和政策的帖子。我們將群體行為定義為：兩個（含）以上的人，受到參與者而非政府官員或政府代表的鼓動或控制，追求目標的行為。我們的「潛在群體行為」理論上包括任何有可能引發群體行為的事件，但是為了保守起見，並確保編碼規則清楚明確且可以重複，我們將這一範疇限制在a)包含抗議活動或有組織的人群組成；b)與曾經組織或引發群體行為的個人有關；c)與曾經引發抗議或群體行為的民族主義或民族主義情緒有關。

事件是指，對效命於政府或非政府實體的審查者的批判，包括個人和公司。色情是指，包含色情或明顯性方面內容的電影、網站或媒體的廣告或新聞。政策指政府聲明或政府活動報告，包括國內或對外政策。其他新聞是指對上述4類事件以外的事件的報告。

最後，我們進行了一項研究以驗證我們編碼規則的可靠性。為此我們把上述規則給兩位熟悉中國政策的人看，並請求他們對87個話題範圍分別進行編碼（每個話題範圍都與一個數量爆發有關），並將其歸入上述的5個範疇中。編碼者獨立工作，獨自對這些事件進行歸類。兩位編碼者的一致率是98.9%，即87個話題中的86個歸類都相同。唯一不同的話題是方濱興（大防火牆的發明者）遭扔鞋事件。這一事件中，既有對審查者的批評，在一定程度上也是群體行為，因為有好幾個人一起向方濱興扔鞋。我們將該事件作為批評審查者的例子，不過不管它怎麼編碼，都不會影響我們的結果。因為我們估計兩個都會遭到審查。

核心假說

我們的核心假說是，數量爆發期間，政府會將話題範圍內所有討論潛在群體行為事件的帖子刪除。也就是說，審查者將不管這些帖子是否有群體行為的可能，或許部分是因為編碼者信度（intercoder reliability）很低。其實，Kuran (1989)和Lohmann (2002)研究表明，正是有關群體行為事件的信息促進了群體行為的產生，因此，要想把這種信息和明確的對群體行為的號召區分開來，即使不是不可能，也是非常困難的。因此，我們假設審查者採用了更簡單的方法判斷帖子是否與潛在群體行為有關，而且他們不會考慮帖子是否是批評政府的。

審查者還試圖把色情和批評審查者的內容全部刪除。但不會刪除政府政策和其他新聞範疇內的帖子。

政府的運作程序

中國政府審查的確切運作程序當然無法觀察到。但是通過跟接近審查機構的人和內部人士的交談，我們相信我們的編碼規則可以視作接近真實程序。（其實，在文章的一個草稿公布后，我們收到了反饋，證實了我們的觀點。）我們手動確定話題範圍，用關鍵詞對帖子進行歸類，並通過統計發帖數量的時間序列數據，自動甄別數量爆發。某些情況下，對現實世界事件的甄別可能發生在事件發生之前，因為審查者會被秘密告知某事將要發生（比如對某個異見分子的逮捕），而這件事可能引發群體行為。在數量爆發期間對事件進行甄別首先幾乎全部需要人工完成，或許有時會輔以演演算法識別特色片語（statistically improbable phrases）。最後，對單個帖子做出審查決定——根據我們的假說，要檢查它是否與某個特定事件有關——幾乎肯定是人工完成的，因為沒有哪個已知的統計或機器學習技術的精度能與中國審查工作的精確程度相比。審查者可能會先用關鍵詞搜索找到相關事件，但他們需要人工閱讀文章，再進行審查。比如，當審查者從網上的討論中找到增城事件的文章，他們可能採取了關鍵詞搜索的方式，但他們可能必須要閱讀全文，這樣才能將增城抗議和增城的其他信息區分開來，比如增城荔枝收穫。

結果

接下來我們介紹3個具體的測試以驗證我們的假說。這些測試是基於：1 帖子數量，2 引發每次數量爆發的事件性質，以及3 被審查的帖子的具體內容。此外，附錄C（見文末）提供了一些證據，表明中國政府的審查行為自相矛盾地反映了中國政府的意圖。

網帖數量

假如審查的目標是禁止有可能引發群體性事件的討論，那麼我們應該會看到，數量爆發期間會比別的時期有更多審查。我們會看到，一些爆發——有群體行為可能的——審查的級別會更高。

為了研究這一模式，我們引入了「審查強度」的概念，即數量爆發期內被審查（刪除）帖子的百分比減去數量爆發期外所有被審查（刪除）帖子的百分比。（基本比率在不同的話題範圍中變動很小，如下圖所示，沒有造成天花板或地板效應)。這說明中國政府的舉措之嚴厲，因為在數量爆發期間進行審查明顯更加困難，網帖數量更多，時間更緊迫，且沒人預先警告什麼時候會出事。

表3的a直方圖顯示的結果似乎支持我們的假說。結果表明，絕大多數的數量爆發的審查強度集中在0附近，但有一條顯著的長尾（坐標軸左側沒有相應的長尾）。顯然數量爆發往往伴隨著審查強度的大幅提高，即使跟接下來的6個月相比也是如此。

中國網路審查制度

能引發數量爆發的事件的性質

我們發現，由群體行為，批評審查者和色情事件引發的數量爆發會遭到審查，但是由討論政府政策和其他新聞引發的發帖量增加則不會。

我們在下一節討論國家批評論。這裡，我們提出針對本次調查結果的三個結論。

首先來看圖3的B列，其審查強度的分佈與A列一樣均勻，並按時間類型顯示。結果很明顯：與群體性事件、批評審查者和色情（分別是紅、橘紅、黃色）相關的事件基本都在坐標系的右邊，表明審查強度很高，而關於政策和新聞的事件基本都在坐標系的左邊（分別是藍、紫色）。群體性事件的審查強度平均是27%，而政策和新聞的平均審查強度分別是1%和4%。[橫坐標（刪除率）基本上數值很小，約為3-5%，上下波動幅度不高。]

第二，我們列出審查強度最高和最低的時間案例，在圖4用相同的顏色標註。群體性事件可能性最高的事件包括內蒙古牧民被運煤車撞死事件、增城孕婦遭保安毆打引發民工騷亂事件、艾未未被捕、撫州征地爆炸。明顯的是，「群體性事件可能性」最高的事件根本與政治無關：日本地震和核電廠事故發生后，浙江出現謠言，稱碘鹽可以抵禦核輻射，於是民眾搶購食鹽。這個謠言沒有科學依據，也和國家無關，但卻遭到了嚴格的審查；原因大概是，該事件中，政府失去了對群體性情緒在當地的控制。實際上，我們發現在當地網站上的碘鹽謠言審查要比全國性網站來得嚴格。[在圖4的兩個相關事件中，社交媒體的新聞和討論中經常會色情內容，以吸引眼球。]

中國網路審查制度

與我們的「潛在群體性事件防範論」結論一致的是，一些審查最嚴格的事件不是對國家政策的批評或討論，而是可能引發群體聚集的當地性群體表達。一個例子是，溫州的一個當地網站出現了一些帖子，聲援環保人士陳飛。陳飛力挺用於保護當地環境的環保彩票。雖然陳飛受到了中央政府的支持，但是，所有關於他的帖子都被當地網站刪除了，原因有可能是他過去阻止過群體性活動。2000年後，陳飛建立了綠色環保志願者協會，擁有超過400名註冊會員，創立了中國首個「無塑料袋村莊」，最終推動了關於使用塑料袋的立法程序。另一個例子是關於江蘇沭陽兒童鉛中毒事件。相關的網路帖子討論了天能集團的電池廠導致兒童健康狀況受污染的事情，醫院拒絕向受害兒童父母公布檢測報告。2011年1月，沭陽村民在電池廠門前要求解釋。審查者絕不容許這類群體性集結，無論它是支持政府或批評政府。

所有被標記為「可能發生群體性活動」的事件中，事件內的審查比事件外的審查更為密集。另外，平均來看，這些事件比其他事件的審查率要高得多。這些事實與我們的分析一致，即，審查者會主動搜尋並刪除那些與「可能發生群體性活動」事件有關的帖子。不過，我們想進一步分析審查的不同力度：雖然我們已經採取的定量分析，但顯然，「可能發生群體性活動」中的某些事件要比另一些事件敏感性高得多。因此，通過分析個別事件，可以看出，審查程度低的事件，其發生群體性活動的可能性也較低。

以下舉例分析。動畫電影《功夫熊貓2》上映時，關於電影種族歧視的抗議出現了言論的數量爆發，但未來發生大規模抗議的可能性顯然極為有限。另一個例子是錢雲會事件，這位浙江農民帶領村民抗議當地政府征地補償不公，後來被卡車壓死。錢雲會遭遇的這兩件事都發生在我們調查以前。在我們調查期間，錢雲會的遺屬為了爭取賠償又引發了一次熱點，但這一事件的數量爆發更為集中、事件本身煽動性較低。

最後，我們給出三類事件更為詳細的一些例子，其中每一類事件都基於某一話題領域的隨機帖子。首先，圖5給出了4個例子，一開始都是審查力度很低，然後相關言論突然出現數量爆發，審查強度也就隨之升高。無論是刪帖的絕對數量，還是刪帖占所有帖子的比例，都是非常高的。4張圖表（還有其他例子，本文無法一一列舉）的結論很明顯：中國政府在言論數量爆發期會加倍投入審查。

中國網路審查制度

我們進一步分析了（按照Grimmer and King 2011的分析方法）可能發生群體性事件的言論數量爆發期間沒有被刪除的那些帖子，如圖5的a坐標所示，紅色區域並沒有完全覆蓋灰色區域。這些未被刪除的帖子與事件沒有直接關係，而是恰巧包含了事件話題的敏感詞。我們再次發現，審查者在增加審查強度時，操作非常精準。自動分類不可能達到如此高的準確度。

第二，我們在表6種給出4個話題，這4個話題都有至少1個數量爆發期，但沒有遭到審查。其中包括重大而富有爭議性、具有潛在煽動性的話題，計劃生育、教育改革、腐敗和電價調整，但均與地方性的群體表達無關，所以，審查強度一直非常低。

中國網路審查制度

最後，我們發現，幾乎所有的話題都呈現出圖5和圖6的趨勢。兩種模式如圖7所示。這些話題包括色情內容（坐標a）和對審查者的批評（坐標b）。這些話題的特點是，6個月以來其審查強度始終很高，並且，沒有在數量爆發期加大審查強度。美國政客將色情內容視為挑戰國家的「道德操守」，中國領導層也將其視為腐蝕年輕人身心健康的產物，並且是社會不穩定因素之一；總之，必須對其進行審查。

更令人驚訝的是審查者的「不當行為」：他們允許中國人批評任何一位政治家，但不允許批評審查者自己；允許批評每一項政策，但不允許批評言論審查政策本身；允許批評每一個項目，但不允許批評他們自己的項目。就算是用中國自己的牽強理由來看，圖7所示的結果仍可稱得上是驚人之舉。

哪些要刪除，哪些無需刪除

我們的最後一項測試是比較刪除的帖子和未刪除的帖子的內容。「國家批評防範論」認為，批評政府的帖子都會被刪除，無論它有沒有引發群體性事件的可能性。相反，「潛在群體性事件防範論」認為，有關群體性事件的帖子都會被刪除，無論它是批評或讚揚國家；而那些無關群體性事件的帖子，無論對政府是褒是貶，都不會被刪除。

為了執行此次大規模測試，我們需要一種自動文本分析手段。因此，我們將Hopkins和King（2010）分析英語的方法應用到漢語文本。這個方法不需要機器翻譯、個別話題分類計算或鑒別每個話題的關鍵詞（當然，免不了會發生錯誤）；其方法只需一小部分的中文文本。我們採用了一系列嚴格的測試，並獲得高度精確的結果——如同人工閱讀和分類一般。我們在附件B中描述這一方法，並列舉若干例子。

就我們的分析而言，我們將帖子內容分為3類：（1）批評政府（2）支持政府（3）與事件無關的報道或事實性的報道。不過，我們對每個類別中的帖子比例沒有興趣，對刪除的帖子和未刪除的帖子的比例也沒興趣——那是Hopkins和King的研究方法。我們的方法是，估計並比較每一個類別中被刪除的帖子的比例。因此，我們使用的貝葉斯方法（參見附件2），對Hopkins和King的方法進行改進。

我們首先分析特定的事件，然後從所有的事件中隨機抽取帖子。關於群體性事件，我們精確選擇了艾未未被捕、內蒙古抗議、撫州拆遷爆炸事件。圖8的坐標（a）呈現了每一個事件中刪除帖子的比例，其中，批評政府的用紅色表示，支持政府的用綠色表示；縱坐標是95%置信區間。顯而易見，無論帖子支持或反對政府，刪除率都很高，平均是80%。雖然常識認為刪帖是為了過濾批評政府的聲音，但測試表明，批評政府的帖子的被刪概率並不比支持政府的帖子高。這支持了「群體性事件防範論」結論，並與「國家批評論」相悖。

中國網路審查制度

我們還從圖6中選取了三個主題，進行平行試驗。這三個主題都沒有群體性活動的可能性：計劃生育、反腐政策和物價上漲的新聞。結論與我們的預期相符：無論支持或反對政府，相關帖子的刪除率都很低，平均約為10%。

為了檢驗以上結論的普遍有效性，我們從所有數量爆發的主題中隨機選取沒有群體性活動可能性的帖子。圖9顯示的結論與圖8一致，群體性活動可能性高的事件刪除率也高，無論帖子是支持還是反對政府，而新聞和政策性事件的帖子刪除率較低。同上，支持或反對政府的態度對刪除率影響不大，而與群體性活動的關係則很大。

中國網路審查制度

結論很明白：如果帖子牽涉到群體性活動的可能性，那就會被刪除；否則就不會被刪除。無論帖子支持或反對政府、領導人或政策，都與刪除率無關。

最後，我們列舉幾個中國社交媒體的帖子內容。首先，我們舉出兩個無關群體性活動可能性的帖子，雖然帖子內容都批評了政府和領導人。例如，以下帖子直接進行了人身攻擊，點名當地政府：

這是一個漠視生命的市政府[陝西省榆林市]、一個官員橫行的市政府、一個沒有公正的市政府，一個低級趣味的市政府，一個包二奶的市政府，一個為錢不要臉的市政府，一個為個權不要人格的市政府，一個沒有血性的市政府，一個沒有道德底線的市政府，一個出爾反爾的市政府，一個忘恩負義的市政府，一個不要子孫後代的市政府，一個什麼怪事都出的市政府，一個什麼的市政府，只要你想到的就有……

另一位博主尖銳地批評了中國的計劃生育政策，同樣未被刪除：

可以提倡人民自願節育，但讓人斷子絕孫的強制節育，搞30年已是忍辱負重，不能形成路徑依賴，將不得已的臨時性惡政無限延長……可以毫不誇張地講，計劃生育是農民最痛苦的暴政。雖說是「必要的惡」，卻是世界少有，遭到世界輿論的廣泛譴責，實在不該以此為豪。

最後，以下博文尖銳批評中國共產黨背棄民主和憲政諾言，提及天安門事件，但也沒被刪除：

我一直將中國的近代史視為一場改良與革命的賽跑，在清末的大賽場上，最終革命跑到了頭，改良的一切設計，在武昌起義槍聲響起后成了廢紙。中共的民主憲政承諾，是抗戰結束前開出的遠期支票，超過了一個甲子仍未兌現。當今中國社會缺乏誠信，要從毛澤東開始問責。鄧小平在80年代提出的政治體制改革，在「8964」事件后被長期擱置……近年所謂「黨主立憲」之說，也是主流學者為維繫一黨執政地位所做的政治設計。

這些帖子既非特例，也不反常：我們的資料庫中還有幾千條。負面帖子，包括所謂的敏感主題，例如天安門事件和一黨執政，並沒有瞞過審查體制。證據表明，審查者無意阻止這些帖子的出現。相反，他們注重刪除關於群體性活動可能性的帖子，無論是否牽涉到中國領導人或政府的政策。

為了強調以上論點，我們給出兩個有關群體性事件可能性的帖子，這兩個帖子都支持政府，但卻很快遭到刪除。在撫州爆炸事件中，政府刪除了這個帖子，雖然它明確譴責錢明奇，並褒揚政府在動遷過程中的工作：

爆炸案造成他本人和多名政府工作人員死亡的悲劇，即使錢明奇在微博里所稱拆遷造成的個人損失是屬實的，我們也應譴責他的極端報復行為……政府在連續出台保護被拆遷者利益的政府法規，媒體也在為公平對待被拆遷者大聲疾呼，各地拆遷補償款上升速度，大多高於商品房售價上升速度，在不少地方，補償款已經足以改變一個家庭的命運。

另一個例子是下面這個被刪的帖子，它同樣支持政府。該帖指責當地領導冉建新涉嫌腐敗，而他在被警察監禁期間的死亡引發利川遊行：

湖北省巴東縣委宣傳部都在其官方網站發布新聞通稿稱，冉建新在擔任利川市都亭辦事處常委書記、主任期間，利用職務之便，在征地拆遷、工程發包等事項中為他人謀取利益，收受他人賄賂，涉嫌受賄犯罪。

結語

我們提供的新數據和新方法表明了中國人、中國的言論審查機制以及中國政府在不同領域的關注點，還呈現了政府壓制信息傳播的秘密機制，以及中國領導層的關注點、意圖和目標。

證據表明，中國的領導層允許社交媒體發展，允許對政府、政策、領導人的負面、正面批評。因此，政府的政策有時讓人感覺非常糟糕，領導人臉面無光，這和民主國家的民選政客並無二致；不過，他們似乎已經意識到，臉面無光不會影響到他們的位子，只要不發生群體性事件——政府以外的權力控制群眾的行為。可以說，中國人在個體上是自由的，但群體上是受控制的。

關於政府此類策略的研究已有很多，我們在此提出一些初步性設想。首先，只要不發生群體性事件，社交媒體就是獲取對中國政府和官員的意見的良好渠道。當然，公共表達寬鬆了，政府也越來越懂得如何滿足並緩和公眾的情緒。從這個角度來看，目前的模式或許是政府利用社交媒體掌握權力的最佳手段。例如，Dimitrov（2008）提出，人民如果不再抱怨政府，政府就會垮台；因為，這表明在人民心中，政府已經沒有了合法性。同樣，Egorov、Guriev、Sonin（2009）提出，缺少自然資源優勢的獨裁政府會允許媒體更為自由，以便增強其執政能力。引申開來講，這與我們的中國研究遙相呼應，即，容許批評可以增強政府的合法性，鞏固政權。Lorentzen（2012）提出了一種規範性模式，威權政府調和媒體自由與言論審查這兩種政策，在減少地方腐敗的同時，鞏固政權的穩定性。也許，研究規範性模式的學者可以吸收我們的經驗性結論，進一步發展他們的理論。

推開來講，本文的數據引申出研究中國政治、比較政治學的新方法和新思維。就中國研究而言，我們的方法反映了威權政府的彈性、中央－地方關係、次國家層面的政治、國際關係和中國的外交政策。通過分析國家層面和地方層面不同的敏感話題，本文表明，在某些領域，地方政府可以獨立行事。另外，我們的分析明確地揭露了政府的意圖，展現出各級政府的意圖差異。我們分析了社交媒體和言論審查的實際內容，這有助於揭示中國的國際關係和外交政策，例如，民族主義的呈現是否會限制政府的外交活動？最後，中國的審查機制可以被視為一種建設性機構。Nathan（2003）將其視為威權政府彈性機制的一部分，或可反映中國共產黨的體制化和長期執政的秘訣。

就比較政治學而言，我們的工作可以直接展現國家能力、威權政府的長期執政和執政變化。最近關於阿拉伯之春中的網際網路和社交媒體的研究（Ada et al. 2012；Bellin 2012）質疑了這些技術組織群體性活動和擴散地區信息的功能，反而強調這些技術創新對維持威權政府執政的積極作用。Edmond（2012）研究了信息資源（網際網路、社交媒體等）對政權的壞處，而如果政府擁有足夠的經濟能力，它就可以控制信息資源。網際網路和社交媒體的經濟規模目前在中國還不大，而中國政府將言論審查的責任下放到了地方上的網際網路內容提供商，因此，中國有能力發展新興技術的經濟規模。中國是一個相對富裕、有彈性的威權國家，審查機制複雜、有效，也許是全世界獨裁者的關注對象。

我們分析了中國審查機制的主要目標，揭示了中國人的關注點、中國政府的意圖和目標。雖然我們只分析了不同時間段的85個話題，但這種分析還可以延伸到更廣泛的領域。在傳統媒體沒有提供任何線索的情況下，審查行為或可預示政府在線下的下一步行動，為政府政策和商業活動的學術研究和實踐提供啟發。

我們構建了計算機輔助文本分析法，有效分析了中文文本。這些方法還可推廣至其他領域。我們推想，我們的數據手機程序、文本分析手段、總體分析和經驗策略可以延伸至世界其他壓制言論自由的地域。

附錄C

如果說審查行為是衡量政府意圖和意願的一種手段，那麼，這可以為預測政府行為提供些許線索。我們就此進行測試。不過，中國政府的大部分行為都是針對外部事件的評論或反應，都可以事先預測。困難的是那些無法預測的事例，我們在此研究其中與群體性活動可能性有關的事例。

我們本來沒有就此專門搜集數據，但根據手頭的數據，仍可進行間接的驗證。我們採用廣為流傳的數據控制手段（King and Zeng 2001）。首先，我們抽取與群體性活動可能性有關的所有真實事例，然後剔除那些容易被預測的事例。於是，便剩下了兩個事件，這兩個事件都不能事先預測：2011年4月3日艾未未被捕，以及2011年6月25日與越南的南海爭端。我們分析這兩個事例，並證明，政府的反應可以從審查行為的數據中預測出來。另外，正當本文於2012年初收尾之際，中國發生了薄熙來事件，這一件事件被認為「是數十年來振動中國政壇的最大丑聞」（Branigan 2012），並將「困擾下一代中國領導人」（Economy 2012）。碰巧，我們的數據監控還沒結束。因此，這成為了我們研究的第三個事例。

接著，我們要確定審查行為能夠提前多久預測（突發）事件。時間間隔必須足夠長，以顯示審查行為的存在；但也不能太長，以防數據波動淹沒了審查者的干預跡象。我們選擇5天為合適的間隔，這不一定準確，但不影響我們此處的數據。因此，我們架設中國當局預先5天採取行動，並且在審查模式上可以體現出這一跡象。

中國網路審查制度

在圖11的坐標a中，我們來觀察艾未未被捕事件。縱坐標是被刪除的帖子比例。灰色區域是從（我們假設的）採取行動的日期到艾未未真正被捕的日期。我們從新聞媒體中無法得知艾未未即將被捕。藍色線段是實際的審查力度，紅色線段是根據此前的數據推算出來的趨勢。4月3日紅線與藍線的差距是我們的粗略估計；如果政府沒有特別行動，實際的審查力度應該是將近10%；但最終的實際審查力度是預估值的兩倍。為了證明這不是偶然現象，我們選取了任意5天間隔，均沒有出現如上反常現象。

我們用這個方法再來驗證圖11坐標b的南海事件。南海的石油勘探導致北京與河內關係持續緊張，審查率暴增。根據媒體報道，衝突一直持續，直到6月25日兩國突然達成和平協議。我們再度隨機採樣，證明這一反常現象絕非偶然。

最後，我們來看薄熙來事件。薄熙來的父親是中共八大元老之一。薄熙來被認為是2012年秋季召開的中共十八大的新一屆常委熱門人選。可是，他的政治生命卻突然中介，2012年2月6日，王立軍逃入成都的美領館。四天前，王立軍剛被薄熙來免職。王立軍揭發了薄熙來參與謀殺英國公民的秘密，然後，薄熙來被免職。由於事件的反常性質揭示了中共高層內部的分歧，我們專門來分析2月2日王立軍被薄熙來免職的事件。據稱，王立軍與薄熙來就海伍德之死發生了衝突，引發薄熙來採取行動。

我們的分析如圖11坐標c所示，王立軍被免職以前的審查力度趨勢與實際的審查力度差距很大。王被免職以前，媒體沒有任何透露的消息。同樣，我們做了驗證測試，證明這不是偶然現象。

這三個事例都證明了我們的結論，但我們是事後分析，且只有這三個例子，所以，還需要對審查率的預測性做進一步研究。