中国企業の最新AI、完成。ChatGPT・Geminiの最新モデルとほぼ同格のスコアを叩き出す

1 : 2026/01/27(火) 19:16:52.05 ID:0bLVg0ej0

2026年01月27日 10時57分AI
AlibabaがGPT-5.2と同等性能の推論AIモデル「Qwen3-Max-Thinking」を発表
https://gigazine.net/news/20260127-qwen3-max-thinking/

2 : 2026/01/27(火) 19:17:29.50 ID:0bLVg0ej0

中国のIT大手・Alibaba(阿里巴巴)の開発するオープンソース大規模言語モデル「Qwen」シリーズに、新しくフラッグシップ推論モデル「Qwen3-Max-Thinking」が加わりました。

Qwenチームによると、「Qwen3-Max-Thinking」はモデルパラメーターを拡張し、強化学習のために大量の計算リソースを活用することで、事実に基づく知識や複雑な推論、指示追従、人間の好みとの整合性、エージェント機能など、複数の面でパフォーマンスが大幅に向上しているとのこと。

以下は「GPT-5.2-Thinking」「Claude-Opus-4.5」「Gemini 3 Pro」「DeepSeek V3.2」「Qwen3-Max-Thinking」の5つのモデルのベンチマークスコアを示した表です。「Qwen3-Max-Thinking」は中国語評価テストの「C-Eval」や数学の推論ベンチマーク「HMMT 25」(2025年11月版)、広い分野の問題を詰め込んだ「HLE(人類最後の試験)」、「Arena Hard v2」でトップのスコアを獲得しているほか、他のテストでも4つのモデルに匹敵するスコアとなっています。

3 : 2026/01/27(火) 19:18:05.18 ID:kTM6BPTv0

アプリあんの?

11 : 2026/01/27(火) 19:23:18.56 ID:DeKsjrwN0

>>3
Qwen Chatってアプリがある
ブラウザからも使用可

4 : 2026/01/27(火) 19:18:26.32 ID:+mlBID1md

これオープンソースじゃないんだよなあ

5 : 2026/01/27(火) 19:18:54.74 ID:n83+vdkp0

スコアとかいうけどどれも大差ないしね

6 : 2026/01/27(火) 19:19:00.43 ID:d/TG9yfo0

これでオープンソースかよ
マジ神じゃん

8 : 2026/01/27(火) 19:21:19.44 ID:+mlBID1md

>>6
Maxだけいまんとこクローズ

7 : 2026/01/27(火) 19:21:02.52 ID:S7MwCui40

性能はアメリカとトントンなのに圧倒的に安い中国製AI
まともにビジネスしたら勝負にならない

9 : 2026/01/27(火) 19:22:08.64 ID:+mlBID1md

中華オープンモデルの最新はKimi 2.5

10 : 2026/01/27(火) 19:23:00.66 ID:HuUxdIbt0

エ口は？エ口はどうなの？

12 : 2026/01/27(火) 19:25:42.45 ID:ZigpW3is0

今のところ、学習の計算量の勝負だから
中国は得意そうだな

17 : 2026/01/27(火) 19:29:16.91 ID:LRmSBznZ0

>>12
データに対するスケーリング則が本当なら大量の中国語データを持ってるのも大きい気がする
何しろ人口が多いし

13 : 2026/01/27(火) 19:26:22.70 ID:9Zcqgh+n0

画像や動画生成は中国一強になりつつある

15 : 2026/01/27(火) 19:28:22.76 ID:+mlBID1md

>>13
非エ口は🍌一強だろ

14 : 2026/01/27(火) 19:27:38.31 ID:3jclL3jY0

新勢力きたか

16 : 2026/01/27(火) 19:28:33.18 ID:LRmSBznZ0

どこぞの無名ならともかくAlibabaなら実際そこそこ賢いんだろうな

18 : 2026/01/27(火) 19:29:21.40 ID:orLLlcBQ0

表現の自由云々はgrokも権威主義傾向あるらしいし
アメカス製も美点消えてくやろな
そしたらほんとにエ口頼みになる

19 : 2026/01/27(火) 19:29:24.13 ID:3jclL3jY0

MAGIシステムに加えるか

20 : 2026/01/27(火) 19:30:29.70 ID:Idv4pjJJ0

速度より内容じゃないの？

21 : 2026/01/27(火) 19:30:44.32 ID:lM8WOuJS0

今のところチャッピー無料版より反応は早いように感じる

23 : 2026/01/27(火) 19:31:30.31 ID:+mlBID1md

Qwen3-235bがご家庭のPCでギリ動くローカルLLMでは最強

KimiやGLMの方が高性能だがご家庭のPCではほぼ無理

24 : 2026/01/27(火) 19:33:25.79 ID:RYRQ0YRpM

>>23
GLMのFlashなら余裕

25 : 2026/01/27(火) 19:34:18.63 ID:+mlBID1md

>>24
Flashは性能が微妙

27 : 2026/01/27(火) 19:36:09.38 ID:LRmSBznZ0

Qwen3 Maxはパラメーター1テラとか言ってるから公開されても単純計算でGPUメモリ1テラとか必要なんじゃないの
となるとNvidia H200（メモリ141GB）が7台は必要

28 : 2026/01/27(火) 19:37:47.12 ID:bXpnlE380

脱衣動画ができたら覇権取れるだろな
まずはエ口からだよ

29 : 2026/01/27(火) 19:38:54.01 ID:pI/pSRDU0

U23アジアカップ決勝の勝敗予想を中国語で聞いたら中国が勝利するって言う程度の性能

30 : 2026/01/27(火) 19:41:59.09 ID:qDtmbHrE0

中国のAIにアクセスする方法がない

31 : 2026/01/27(火) 19:44:24.37 ID:/QAK50mh0

買い物させられそう

33 : 2026/01/27(火) 19:46:53.42 ID:7QTbjgSZ0

ロングコンテキスト弱いから駄目だな
長いコンテキストを解析させるとハルシネーションやド忘れを起こすのが今のAIの弱点
だからAI駆動コーディングはトライ&エラーの自動修正が何百回何千回も走っている
もしロングコンテキストの解析に強いAIが無料で使えたら革命的だが

35 : 2026/01/27(火) 19:54:19.29 ID:T8tsBNg90

同じならチャッピーでよくない

37 : 2026/01/27(火) 20:11:15.77 ID:1KgknxKx0

今のAIって語彙力ないと使えなくね？
もっと具体的に言えみたいに言ってくるのウゼー
AIなら俺の心情もっと察しろよ

38 : 2026/01/27(火) 20:14:18.53 ID:b6hTxRQ70

でも天安門って入力した地点でなんかされるんだろ？