中国企業の最新AI、完成。ChatGPT・Geminiの最新モデルとほぼ同格のスコアを叩き出す

1 : 2026/01/27(火) 19:16:52.05 ID:0bLVg0ej0

2026年01月27日 10時57分AI
AlibabaがGPT-5.2と同等性能の推論AIモデル「Qwen3-Max-Thinking」を発表
https://gigazine.net/news/20260127-qwen3-max-thinking/

レス1番の画像1
2 : 2026/01/27(火) 19:17:29.50 ID:0bLVg0ej0
中国のIT大手・Alibaba(阿里巴巴)の開発するオープンソース大規模言語モデル「Qwen」シリーズに、新しくフラッグシップ推論モデル「Qwen3-Max-Thinking」が加わりました。

Qwenチームによると、「Qwen3-Max-Thinking」はモデルパラメーターを拡張し、強化学習のために大量の計算リソースを活用することで、事実に基づく知識や複雑な推論、指示追従、人間の好みとの整合性、エージェント機能など、複数の面でパフォーマンスが大幅に向上しているとのこと。

以下は「GPT-5.2-Thinking」「Claude-Opus-4.5」「Gemini 3 Pro」「DeepSeek V3.2」「Qwen3-Max-Thinking」の5つのモデルのベンチマークスコアを示した表です。「Qwen3-Max-Thinking」は中国語評価テストの「C-Eval」や数学の推論ベンチマーク「HMMT 25」(2025年11月版)、広い分野の問題を詰め込んだ「HLE(人類最後の試験)」、「Arena Hard v2」でトップのスコアを獲得しているほか、他のテストでも4つのモデルに匹敵するスコアとなっています。

3 : 2026/01/27(火) 19:18:05.18 ID:kTM6BPTv0
アプリあんの?
11 : 2026/01/27(火) 19:23:18.56 ID:DeKsjrwN0
>>3
Qwen Chatってアプリがある
ブラウザからも使用可
4 : 2026/01/27(火) 19:18:26.32 ID:+mlBID1md
これオープンソースじゃないんだよなあ
5 : 2026/01/27(火) 19:18:54.74 ID:n83+vdkp0
スコアとかいうけどどれも大差ないしね
6 : 2026/01/27(火) 19:19:00.43 ID:d/TG9yfo0
これでオープンソースかよ
マジ神じゃん
8 : 2026/01/27(火) 19:21:19.44 ID:+mlBID1md
>>6
Maxだけいまんとこクローズ
7 : 2026/01/27(火) 19:21:02.52 ID:S7MwCui40
性能はアメリカとトントンなのに圧倒的に安い中国製AI
まともにビジネスしたら勝負にならない
9 : 2026/01/27(火) 19:22:08.64 ID:+mlBID1md
中華オープンモデルの最新はKimi 2.5
10 : 2026/01/27(火) 19:23:00.66 ID:HuUxdIbt0
エ口は?エ口はどうなの?
12 : 2026/01/27(火) 19:25:42.45 ID:ZigpW3is0
今のところ、学習の計算量の勝負だから
中国は得意そうだな
17 : 2026/01/27(火) 19:29:16.91 ID:LRmSBznZ0
>>12
データに対するスケーリング則が本当なら大量の中国語データを持ってるのも大きい気がする
何しろ人口が多いし
13 : 2026/01/27(火) 19:26:22.70 ID:9Zcqgh+n0
画像や動画生成は中国一強になりつつある
15 : 2026/01/27(火) 19:28:22.76 ID:+mlBID1md
>>13
非エ口は🍌一強だろ
14 : 2026/01/27(火) 19:27:38.31 ID:3jclL3jY0
新勢力きたか
16 : 2026/01/27(火) 19:28:33.18 ID:LRmSBznZ0
どこぞの無名ならともかくAlibabaなら実際そこそこ賢いんだろうな
18 : 2026/01/27(火) 19:29:21.40 ID:orLLlcBQ0
表現の自由云々はgrokも権威主義傾向あるらしいし
アメカス製も美点消えてくやろな
そしたらほんとにエ口頼みになる
19 : 2026/01/27(火) 19:29:24.13 ID:3jclL3jY0
MAGIシステムに加えるか
20 : 2026/01/27(火) 19:30:29.70 ID:Idv4pjJJ0
速度より内容じゃないの?
21 : 2026/01/27(火) 19:30:44.32 ID:lM8WOuJS0
今のところチャッピー無料版より反応は早いように感じる
23 : 2026/01/27(火) 19:31:30.31 ID:+mlBID1md
Qwen3-235bがご家庭のPCでギリ動くローカルLLMでは最強

KimiやGLMの方が高性能だがご家庭のPCではほぼ無理

24 : 2026/01/27(火) 19:33:25.79 ID:RYRQ0YRpM
>>23
GLMのFlashなら余裕
25 : 2026/01/27(火) 19:34:18.63 ID:+mlBID1md
>>24
Flashは性能が微妙
27 : 2026/01/27(火) 19:36:09.38 ID:LRmSBznZ0
Qwen3 Maxはパラメーター1テラとか言ってるから公開されても単純計算でGPUメモリ1テラとか必要なんじゃないの
となるとNvidia H200(メモリ141GB)が7台は必要
28 : 2026/01/27(火) 19:37:47.12 ID:bXpnlE380
脱衣動画ができたら覇権取れるだろな
まずはエ口からだよ
29 : 2026/01/27(火) 19:38:54.01 ID:pI/pSRDU0
U23アジアカップ決勝の勝敗予想を中国語で聞いたら中国が勝利するって言う程度の性能
30 : 2026/01/27(火) 19:41:59.09 ID:qDtmbHrE0
中国のAIにアクセスする方法がない
31 : 2026/01/27(火) 19:44:24.37 ID:/QAK50mh0
買い物させられそう
33 : 2026/01/27(火) 19:46:53.42 ID:7QTbjgSZ0
ロングコンテキスト弱いから駄目だな
長いコンテキストを解析させるとハルシネーションやド忘れを起こすのが今のAIの弱点
だからAI駆動コーディングはトライ&エラーの自動修正が何百回何千回も走っている
もしロングコンテキストの解析に強いAIが無料で使えたら革命的だが
35 : 2026/01/27(火) 19:54:19.29 ID:T8tsBNg90
同じならチャッピーでよくない
37 : 2026/01/27(火) 20:11:15.77 ID:1KgknxKx0
今のAIって語彙力ないと使えなくね?
もっと具体的に言えみたいに言ってくるのウゼー
AIなら俺の心情もっと察しろよ
38 : 2026/01/27(火) 20:14:18.53 ID:b6hTxRQ70
でも天安門って入力した地点でなんかされるんだろ?

コメント

タイトルとURLをコピーしました