2025-05-13
【學術亮點-頂級會議論文】透過解碼器融合與強化學習進行的問題生成
字體大小
小
中
大
【學術亮點-頂級會議論文】透過解碼器融合與強化學習進行的問題生成
AI core Technology: Advanced Research and Resource Integration Platform or AI Technology【Department of Computer Science and Engineering / Yao-Chung Fan / Professor】
核心技術:AI核心技術之進階研究與資源整合平台【資訊工程學系范耀中教授】
上架日期:2024/7/10
AI core Technology: Advanced Research and Resource Integration Platform or AI Technology【Department of Computer Science and Engineering / Yao-Chung Fan / Professor】
核心技術:AI核心技術之進階研究與資源整合平台【資訊工程學系范耀中教授】
論文篇名 | 英文:Handover QG: Question Generation by Decoder Fusion and Reinforcement Learning 中文:透過解碼器融合與強化學習進行的問題生成 |
期刊名稱 | 2025 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2025) (指標清單會議) |
發表年份, 卷數, 起迄頁數 | The Proceeding of The ICASSP 【Accepted SPS journal paper】IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2024, Vol. 32, pp. 3644-3655. |
作者 | Ho-Lam Chung; Ying-Hong Chan; Yao-Chung Fan(范耀中)∗ |
DOI | 10.1109/TASLP.2024.3426292 |
中文摘要 | 近年來,問題生成(Question Generation, QG) 作為一個研究主題受到了廣泛關注,尤其是在其支援自動化閱讀理解測驗出題方面的潛力。然而,目前的 QG 模型大多訓練於事實型(factoid-type)數據集上,這類問題通常過於簡單,難以有效評估進階的理解能力。 實驗評估結果顯示,Handover QG 明顯優於現有基準模型,BLEU-4 分數從 5.31 提升至 6.48。人類評估也證實,本模型所生成的問題具備可回答性與適當的難度。總體而言,Handover QG 架構為生成用於閱讀理解評量的進階問題提供了一個具前景的解決方案。 一種具潛力的替代方案是,使用**考試型數據集(exam-type datasets)**來訓練 QG 模型,因為這些數據通常包含需要內容推理的複雜問題。不過,與事實型問題相比,考試型訓練資料的數量仍相對稀少。 為了解決這一問題並提升高階問題的生成品質,我們提出了Handover QG 架構。此架構透過考試型 QG 模型與事實型 QG 模型的聯合訓練,並以交替的方式使用兩者的解碼器來控制問題生成流程。此外,我們還引入了**強化學習(Reinforcement Learning)**以進一步提升模型效能。 |
英文摘要 | Using large language models, this paper presents techniques to improve extremely low-resourced indigenous language translations. Our approaches are grounded in the use of (1) the presence of a datastore consisting of a limited number of parallel translation examples, (2) the inherent capabilities of LLMs like GPT-3.5, and (3) a word-level translation dictionary. We harness the potential of LLMs and in-context learning techniques in such a setting for using LLM as universal translators for extremely low-resourced languages. Our methodology hinges on utilizing LLMs as language compilers for selected language pairs, hypothesizing that they could internalize syntactic structures to facilitate accurate translation. We introduce three techniques: KNN-Prompting with Retrieved Prompting Context, Chain-of-Thought Prompting, and Learning-from-Mistakes Prompting, with the last method addressing past errors. The evaluation results suggest that, even with limited corpora, LLMs, when paired with proper prompting, can effectively translate extremely low-resource languages. |
發表成果與AI計畫研究主題相關性 | Handover QG 可以結合農業場景,打造智能化問答或學習系統。 1.農業訓練教材自動出題:針對農業課程、農民學習手冊,使用 Handover QG 自動生成高階理解問題,訓練學員的實務判斷能力(如:根據一段病蟲害描述生成推理性問題)。 2.智能農業助理問答生成:讓農業AI助手具備根據實時環境資料或文本記錄生成合理問題的能力,例如從土壤數據報告中自動產出問題:「這樣的pH值是否適合番茄種植?」 |