2024-08-26
【學術亮點-頂級會議論文】MDHC 策略與域內預訓練在迷因說服技術多語言偵測的比較
字體大小
小
中
大
【學術亮點-頂級會議論文】MDHC 策略與域內預訓練在迷因說服技術多語言偵測的比較
AI core Technology: Advanced Research and Resource Integration Platform or AI Technology【Department of Computer Science and Engineering / Yao-Chung Fan / Associate Professor】
核心技術:AI核心技術之進階研究與資源整合平台【資訊工程學系范耀中副教授】
上架日期:2024/8/15
AI core Technology: Advanced Research and Resource Integration Platform or AI Technology【Department of Computer Science and Engineering / Yao-Chung Fan / Associate Professor】
核心技術:AI核心技術之進階研究與資源整合平台【資訊工程學系范耀中副教授】
論文篇名 | 英文:A Comparison of MDHC Strategy and In-domain Pre-training for Multilingual Detection of Persuasion Techniques in Memes 中文:MDHC 策略與域內預訓練在迷因說服技術多語言偵測的比較 |
期刊名稱 | SemEval-2024 Annual Conference of the North American Chapter of the Association for Computational Linguistics, NAACL 2024 (指標清單期刊) |
發表年份, 卷數, 起迄頁數 | In Proceedings of the NAACL Workshop on Semantic Evaluation (SemEval-2024@ACL), pages 1868–1875, Mexico City, Mexico from June 10th to 11th, 2024. Association for Computational Linguistics. |
作者 | Shih-wei Guo, Yao-Chung Fan(范耀中)∗ |
DOI | 10.18653/v1/2024.semeval-1.262 |
中文摘要 | 本研究提出了一種系統化的方法,用於識別多語言迷因中的22種說服技巧。我們探討了各種微調技術與分類策略,如數據增強、問題轉換,以及階層式多標籤分類策略。識別迷因中的說服技巧涉及多模態任務。我們微調了XLM-RoBERTA-large-twitter語言模型,著重於特定領域的語言建模,並將其與CLIP視覺模型的嵌入整合,以同時考慮圖像與文字特徵。在實驗中,我們使用英語的官方驗證數據來評估我們方法的有效性。我們的系統在比賽中取得了具有競爭力的排名,在Subtask1和Subtask2b中橫跨四種語言:英語、保加利亞語、北馬其頓語和阿拉伯語。值得一提的是,我們在阿拉伯語的Subtask1中獲得了第2名的成績。 |
英文摘要 | This study presents a systematic method for identifying 22 persuasive techniques used in multilingual memes. We explored various fine-tuning techniques and classification strategies, such as data augmentation, problem transformation, and hierarchical multi-label classification strategies. Identifying persuasive techniques in memes involves a multimodal task. We fine-tuned the XLM-RoBERTA-large-twitter language model, focusing on domain-specific language modeling, and integrated it with the CLIP visual model’s embedding to consider image and text features simultaneously. In our experiments, we evaluated the effectiveness of our approach by using official validation data in English. Our system in the competition, achieving competitive rankings in Subtask1 and Subtask2b across four languages: English, Bulgarian, North Macedonian, and Arabic. Significantly, we achieved 2nd place ranking for Arabic language in Subtask 1. |
發表成果與AI計畫研究主題相關性 | 設計多分類器進行,進行階層式分類任務優化與指標執行。在此共享任務中,我們所設計的分類語言模型,效果為全部參加團隊第一名之佳績。本技術之關鍵特色為多語言與跨語系綜合判斷。分類模型為所有AI自動化系統之基礎架構。 |