當深度推理大模型化身考生 “李華”,面對英語學科的獨特要求,能否達到人類教師的高分標準?
6月8日,伴隨著2025高考英語考試,一支由國產第一梯隊大模型組成的”考生隊伍”也進入了考場,題目正是今年高考英語北京卷的作文題目。其中,訊飛星火憑借優秀的語言能力拔得頭籌,成為本屆大模型高考“狀元”。
據悉,本次“大考”均在關閉聯網功能,并開啟深度思考模式的條件下進行測試,題目要求以高三學生"李華"的視角,圍繞聯合國倡議征集活動向外國好友Jim撰寫建議郵件。為確保公正性,主辦方邀請了兩名資深英語老師進行“盲評”。參加考試的大模型包括DeepSeek R1、ChatGPT o3、通義千問Qwen3、騰訊混元T1、訊飛星火、百度文心X1六款深度推理大模型產品,堪稱AI領域"最強考生天團"。
經過嚴格評閱,六款模型最終排名揭曉,從高到低依次為:訊飛星火、DeepSeek R1、百度文心X1、通義千問Qwen3、ChatGPT o3、騰訊混元T1。
兩位老師表示,在內容方面,上述深度推理大模型均能做到切中要點,完成寫作任務,其差別主要體現在內容細節多少、細節邏輯關系強弱、觀點表達精準性與簡潔性等方面。
其中,訊飛星火作為冠軍,在審題、表達、邏輯等多個維度均表現出明顯優勢。比如在精準審題上,其提出的“全球氣候行動網絡”緊扣命題;在句式應用方面,能夠靈活運用形式多變的句法結構;而在邏輯上,訊飛星火針對各個核心要點均作出了較為深入的解釋。為此,兩位老師基于往年高考評分標準,分別給出了20分和19分的高分成績。
訊飛星火的奪冠絕非偶然。作為深耕教育領域20余年的行業領軍者,訊飛將長期積累的教學資源與前沿AI技術深度融合,并不斷迭代。此次參賽的訊飛星火,曾在4月20日進行技術升級,升級后在邏輯推理、文本生成等核心能力上提升顯著。
隨著訊飛星火深度推理大模型的持續優化,其角色正從輔助工具向 "智慧伙伴" 演進。展望未來,如何讓大模型真正成為教育創新的"催化劑",打造教育領域的新質生產力,或將成為決定下一階段行業探索的關鍵命題。