IORG 研究方法

IORG 中國對台影響力作戰研究

  • 作者 = IORG
  • 發佈 = 2020.10.20 18:00
  • 更新 = 2021.7.22 21:00

為研究、理解中國對台各項影響力脈絡及現況,IORG 研究「資訊操弄」、「人際滲透」二主題,並綜合建構「影響力網絡」。

本文件說明 IORG 研究方法,包括⋯

  • 資料蒐集
  • 行為分析
  • 心慌週報
  • 資訊操弄
  • 人際滲透

資料蒐集

最後更新時間 = 2021.7.21 13:00

Facebook 華語粉專

IORG 資料工程師自 2021/1/26 至 2021/3/2 以造訪 Facebook 粉專「蔡英文 Tsai Ing-wen」為起始,蒐集 Facebook 推薦的「相關粉專」,再造訪這些粉專,以及它們的相關粉專。持續以滾雪球(snowballing)為方法蒐集,共蒐得 1,579,277 個 Facebook 華語粉專。

分析其貼文時間及內容,有 20,295 個粉專已刪除、13,524 個粉專發生技術問題、448,919 個粉專貼文內容不包含中文漢字、386,080 個粉專最近一次貼文早於 2020/9/1,其中 111,074 為有中文內容且最近一次貼文時間早於 2020/9/1。綜上,刪除 723,925 個粉專,針對 821,533 個 Facebook 粉專蒐集貼文資料。

針對 821,533 個 Facebook 華語粉專,依據其貼文時間平均間距分組,並按分組以不同頻率蒐集貼文資料,每日蒐集約 400 萬則貼文。

微博

IORG 資料工程師於 2020 年 7 月以微博帳號「新華網」為起始滾雪球,共蒐集 138,077 個微博帳號,其中,IORG 篩選帳號分類標籤為「公司」、「行業類別」或追蹤人數大於 10 萬者,自 2020/8/1 起,針對 33,449 個帳號蒐集貼文資料。

  • 2020/10/5 以微博帳號「吳奇隆」為起始,再次滾雪球蒐集相關帳號,將 4,952 個帳號加入追蹤。
  • 2020/10/7 以微博帳號「南海战略态势感知」為起始,再次滾雪球蒐集相關帳號,將 3,553 個帳號加入追蹤。
  • 2020/10/12 以微博帳號「吳克群」為起始,再次滾雪球蒐集相關帳號,並將 8,009 個帳號加入追蹤。

綜上,IORG 共追蹤 49,963 個微博帳號,依據其貼文間距進行分組,並按分組以不同頻率蒐集貼文資料,每日蒐集約 80 萬則貼文。

網路群組

為深入了解台灣各地受資訊操弄之狀況,IORG 與眾多公民運動者、組織協力,在各地建立數個地方研究團隊,透過以下機制,不定期蒐集據研究分析價值的即時通訊及非公開訊息,以觀察、理解下列 4 種網路群組。

  • Facebook Messenger 群組
  • Facebook 社團
  • LINE 聊天群組
  • LINE OpenChat

加入群組的方法,說明如下。

  • IORG 研究員皆以個人身份加入群組,不捏造身分。
  • IORG 研究員會主動加入已知群組。
  • IORG 研究員會透過群組內其他成員的推薦,主動加入新的群組。
  • 加入群組時,可能會有各種驗證機制,IORG 研究員會以成功加入群組為目的,進行驗證。

蒐集訊息內容的方法,說明如下。

  • 研究員定期觀察群組內訊息內容,以機器輔助人工逐筆紀錄回報,方法包括但不限於:單筆人工謄打、單筆複製內容、多筆複製內容。
  • 回報時,IORG 研究員會紀錄群組類型、群組名稱、傳送者顯示名稱、傳送時間、訊息完整文字內容。

行為分析

「來自微博」

  1. IORG 研究員提出論述內容,並根據觀察列出該論述之關鍵詞。
  2. IORG 資料工程師以關鍵詞篩選 Facebook 華語粉專貼文及微博貼文。
  3. 將所有貼文內容由轉為繁體中文,並斷句。
  4. 找出在微博、Facebook 都出現過的語句,比較最早出現的時間,找出哪些語句是「先出現在微博、後出現在 Facebook」。
  5. 將結果交給 IORG 研究員,判定句子「來自微博」,並觀察特定 Facebook 粉專發布「來自微博」內容的行為。

「協同發文」

  1. IORG 研究員提出論述內容,並根據觀察列出該論述之關鍵詞。
  2. IORG 資料工程師以關鍵詞篩選 Facebook 華語粉專貼文,擷取這些貼文所分享的網址。
  3. 找出在 1 分鐘內分享相同連結的 2 個 Facebook 華語粉專。
  4. 將結果交給 IORG 研究員,判定「協同發文」的行為。

心慌週報

「本期最心慌」

心慌週報「本期最心慌」介紹當期週報之熱門議題。

「本期最心慌」資料來源有二,一為 IORG 蒐集的 Facebook 華語粉專貼文;二為 g0v 社群專案 「0archive」公開資料集中的台灣新聞媒體報導,目前包括自由時報、聯合新聞網、中央社、鏡週刊、ETtoday 新聞雲、上報、公共電視新聞網、風傳媒、三立新聞網、東森新聞、中時電子報、蘋果即時新聞網。

  1. IORG 資料工程師按當期週報的時間區間,將區間內的 Facebook 粉專貼文內容、0archive 台灣新聞媒體報導內容,以台灣中央研究院中文詞知識庫小組CKIP Lab)於 2020/9/10 發表於 GitHub 的 CkipTagger 斷詞。
  2. IORG 選擇字串長度超過 1、至少有 1 個中文漢字、不含中文漢字、英、數以外字元,且非停用詞之關鍵詞,為有效詞。
  3. 計算所有有效詞對每一則文章的 TF-IDF
  4. 將每一個有效詞對每一則文章的 TF-IDF 加總,除以該時間區間內的文章總數,即為該關鍵詞的分數。
  5. 將關鍵詞當期分數與上期分數比較,分別列出 Facebook 及 0archive 前 300 高分的關鍵詞。
  6. 關鍵詞列表供 IORG 研究員判讀,人工將關鍵詞分群,形成議題。
  7. 將議題所屬關鍵詞分數加總,即為議題的分數。
  8. 得分最高的議題,即為當期「本期最心慌」之議題。

「維尼這麼說」

心慌週報「維尼這麼說」觀察中國官方論述,及其在台灣的傳播情形。

為了更好了解是否有來自中國的論述在台灣流傳,IORG 自行建立「中國觀察清單」,其中包括中國政府、中共官方組織、中共官媒、中國媒體、中國外交人員、疑似中國網軍的網站或 Twitter 帳號。

截至 2021 年 6 月 9 日,觀察清單上共計 5 個網站、80 個 Twitter 帳號。為避免疑似中國網軍因資訊揭露而改變行為、影響研究,IORG 僅公開中國、中共官方組織、官媒、媒體及外交人員的觀察清單名單

資訊操弄

針對網路內容、社交媒體、即時通訊平台,以資料科學方法做內容及使用者行為分析。IORG 所採用之研究方法包括:網路資料彙整、訊息內容蒐集、內容分析、行為分析、田野調查、人工紀錄及回報。在研究「公開」及「封閉」資訊操弄時,分別採用適當的合作方法。

公開資訊操弄

各類公開網路內容、社交媒體平台是台灣大眾的重要訊息來源,因此是中國對台資訊操弄的重要戰場。

根據中華民國科技部「台灣傳播調查資料庫」《2018 年第二期第二次調查計畫:媒介使用與社會互動》,台灣大眾 79.6% 以 Facebook 為最常使用的社交媒體,其次為 72.6% YouTube。IORG 以 Facebook、YouTube 的資料蒐集、內容分析、行為分析為優先。

除自行蒐集資料外,IORG 亦感謝,並使用台灣公民黑客社群「g0v 台灣零時政府貢獻者所製作、釋出的公開、開源、開放資料集。

IORG 使用 g0v 社群專案「0archive 零時檔案局」的公開、開源資料集。0archive 資料集由 g0v 0archive 專案釋出,資料集內容包括內容農場文章、台灣新聞、中國官媒、類官媒報導、PTT、Dcard、Facebook 公開社團、粉絲專頁、認證帳號貼文。

IORG 使用 g0v 社群專案「newsdiff」的公開資料。g0v newsdiff 資料集包括台灣新聞的報導。

IORG 使用 g0v 社群專案「tvlogger 鄉民看電視」的公開資料。g0v tvlogger 資料集包括台灣五大電視新聞台的報導。

IORG 參考 0archive「追蹤對象列表」,並自行開發,亦與 g0v 社群貢獻者協力開發自動化、系統性的開源工具,自 Facebook、YouTube、微博等網路內容、社交媒體平台蒐集資料、定期更新,以分析、理解內容及使用者行為。

IORG 亦有人工整理 2019 年 6 月至 2020 年 6 月台灣四大報頭版新聞標題及內文資料集,以分析、理解資訊操弄發生於平面媒體的現象。

封閉資訊操弄

除公開平台外,封閉的即時通訊群組、地方組織、社區網絡、實體空間,帶有信任連帶、情感連結,是重要的非公開訊息來源,亦為中國對台資訊操弄的重要戰場。

根據中華民國科技部「台灣傳播調查資料庫」《2018 年第二期第二次調查計畫:媒介使用與社會互動》,台灣大眾 98.5% 以 LINE 為最常使用的即時通訊軟體,其次為 48.2% Facebook Messenger。因此 IORG 以 LINE、Facebook Messenger 的田野調查為優先。

IORG 使用 g0v 台灣零時政府社群專案「Cofacts 真的假的」的開放資料集。Cofacts 資料集由 g0v Cofacts 以 CC0 條款拋棄著作權釋出。Cofacts 資料集包括 Cofacts 使用者自願調查、回報的疑似資訊操弄即時訊息。

為深入了解台灣各地受資訊操弄之狀況,IORG 與眾多公民運動者、組織協力,在各地建立數個地方研究團隊,不定期蒐集據研究分析價值的即時通訊訊息,以觀察、理解各式封閉網路群組,包括 LINE 群組、Facebook Messenger 群組、封閉 Facebook 社團。

IORG 亦透過電傳及人際拜訪,與地方人士聯繫、訪談,以擴充對地方組織、社區網絡的了解,協助調整田野調查的計劃與執行,並解讀、分析透過通報機制蒐集的訊息。

台灣傳播調查資料庫「2018 年第二期第二次調查計畫:媒介使用與社會互動」(MOST 105-2420-H-004-035-SS3)。「台灣傳播調查資料庫」(TCS)計畫主持人為國立政治大學張卿卿教授。詳細資料請參閱 TCS 網頁:http://www.crctaiwan.nctu.edu.tw/index.asp。作者感謝上述機構提供資料協助,惟本文之內容概由作者自行負責。Doi:10.6141/TW-SRDA-D00176-1

人際滲透

針對中國對台的人際滲透行為,包括但不限於組織合作、人脈建立,IORG 採用研究方法,包括:文獻回顧、網路資料彙整、田野調查、當事者訪談、學者訪談、專家訪談。

相較於資訊操弄研究,人際滲透研究仰賴文獻回顧、訪談等質化研究方法。IORG 透過網路公開資料、人際滲透研究的相關文獻,彙整出中國對台建立的人際滲透的網絡,並訪問相關研究領域的學者,基於文獻與學者提供的資訊,與地方研究團隊合作,於人際滲透的實體場域進行田野調查,近距離觀察、訪問。