- 1 : 2026/01/27(火) 19:16:52.05 ID:0bLVg0ej0
-
2026年01月27日 10時57分AI
AlibabaがGPT-5.2と同等性能の推論AIモデル「Qwen3-Max-Thinking」を発表
https://gigazine.net/news/20260127-qwen3-max-thinking/ - 2 : 2026/01/27(火) 19:17:29.50 ID:0bLVg0ej0
- 中国のIT大手・Alibaba(阿里巴巴)の開発するオープンソース大規模言語モデル「Qwen」シリーズに、新しくフラッグシップ推論モデル「Qwen3-Max-Thinking」が加わりました。
Qwenチームによると、「Qwen3-Max-Thinking」はモデルパラメーターを拡張し、強化学習のために大量の計算リソースを活用することで、事実に基づく知識や複雑な推論、指示追従、人間の好みとの整合性、エージェント機能など、複数の面でパフォーマンスが大幅に向上しているとのこと。
以下は「GPT-5.2-Thinking」「Claude-Opus-4.5」「Gemini 3 Pro」「DeepSeek V3.2」「Qwen3-Max-Thinking」の5つのモデルのベンチマークスコアを示した表です。「Qwen3-Max-Thinking」は中国語評価テストの「C-Eval」や数学の推論ベンチマーク「HMMT 25」(2025年11月版)、広い分野の問題を詰め込んだ「HLE(人類最後の試験)」、「Arena Hard v2」でトップのスコアを獲得しているほか、他のテストでも4つのモデルに匹敵するスコアとなっています。
- 3 : 2026/01/27(火) 19:18:05.18 ID:kTM6BPTv0
- アプリあんの?
- 11 : 2026/01/27(火) 19:23:18.56 ID:DeKsjrwN0
- >>3
Qwen Chatってアプリがある
ブラウザからも使用可 - 4 : 2026/01/27(火) 19:18:26.32 ID:+mlBID1md
- これオープンソースじゃないんだよなあ
- 5 : 2026/01/27(火) 19:18:54.74 ID:n83+vdkp0
- スコアとかいうけどどれも大差ないしね
- 6 : 2026/01/27(火) 19:19:00.43 ID:d/TG9yfo0
- これでオープンソースかよ
マジ神じゃん - 8 : 2026/01/27(火) 19:21:19.44 ID:+mlBID1md
- >>6
Maxだけいまんとこクローズ - 7 : 2026/01/27(火) 19:21:02.52 ID:S7MwCui40
- 性能はアメリカとトントンなのに圧倒的に安い中国製AI
まともにビジネスしたら勝負にならない - 9 : 2026/01/27(火) 19:22:08.64 ID:+mlBID1md
- 中華オープンモデルの最新はKimi 2.5
- 10 : 2026/01/27(火) 19:23:00.66 ID:HuUxdIbt0
- エ口は?エ口はどうなの?
- 12 : 2026/01/27(火) 19:25:42.45 ID:ZigpW3is0
- 今のところ、学習の計算量の勝負だから
中国は得意そうだな - 17 : 2026/01/27(火) 19:29:16.91 ID:LRmSBznZ0
- >>12
データに対するスケーリング則が本当なら大量の中国語データを持ってるのも大きい気がする
何しろ人口が多いし - 13 : 2026/01/27(火) 19:26:22.70 ID:9Zcqgh+n0
- 画像や動画生成は中国一強になりつつある
- 15 : 2026/01/27(火) 19:28:22.76 ID:+mlBID1md
- >>13
非エ口は🍌一強だろ - 14 : 2026/01/27(火) 19:27:38.31 ID:3jclL3jY0
- 新勢力きたか
- 16 : 2026/01/27(火) 19:28:33.18 ID:LRmSBznZ0
- どこぞの無名ならともかくAlibabaなら実際そこそこ賢いんだろうな
- 18 : 2026/01/27(火) 19:29:21.40 ID:orLLlcBQ0
- 表現の自由云々はgrokも権威主義傾向あるらしいし
アメカス製も美点消えてくやろな
そしたらほんとにエ口頼みになる - 19 : 2026/01/27(火) 19:29:24.13 ID:3jclL3jY0
- MAGIシステムに加えるか
- 20 : 2026/01/27(火) 19:30:29.70 ID:Idv4pjJJ0
- 速度より内容じゃないの?
- 21 : 2026/01/27(火) 19:30:44.32 ID:lM8WOuJS0
- 今のところチャッピー無料版より反応は早いように感じる
- 23 : 2026/01/27(火) 19:31:30.31 ID:+mlBID1md
- Qwen3-235bがご家庭のPCでギリ動くローカルLLMでは最強
KimiやGLMの方が高性能だがご家庭のPCではほぼ無理
- 24 : 2026/01/27(火) 19:33:25.79 ID:RYRQ0YRpM
- >>23
GLMのFlashなら余裕 - 25 : 2026/01/27(火) 19:34:18.63 ID:+mlBID1md
- >>24
Flashは性能が微妙 - 27 : 2026/01/27(火) 19:36:09.38 ID:LRmSBznZ0
- Qwen3 Maxはパラメーター1テラとか言ってるから公開されても単純計算でGPUメモリ1テラとか必要なんじゃないの
となるとNvidia H200(メモリ141GB)が7台は必要 - 28 : 2026/01/27(火) 19:37:47.12 ID:bXpnlE380
- 脱衣動画ができたら覇権取れるだろな
まずはエ口からだよ - 29 : 2026/01/27(火) 19:38:54.01 ID:pI/pSRDU0
- U23アジアカップ決勝の勝敗予想を中国語で聞いたら中国が勝利するって言う程度の性能
- 30 : 2026/01/27(火) 19:41:59.09 ID:qDtmbHrE0
- 中国のAIにアクセスする方法がない
- 31 : 2026/01/27(火) 19:44:24.37 ID:/QAK50mh0
- 買い物させられそう
- 33 : 2026/01/27(火) 19:46:53.42 ID:7QTbjgSZ0
- ロングコンテキスト弱いから駄目だな
長いコンテキストを解析させるとハルシネーションやド忘れを起こすのが今のAIの弱点
だからAI駆動コーディングはトライ&エラーの自動修正が何百回何千回も走っている
もしロングコンテキストの解析に強いAIが無料で使えたら革命的だが - 35 : 2026/01/27(火) 19:54:19.29 ID:T8tsBNg90
- 同じならチャッピーでよくない
- 37 : 2026/01/27(火) 20:11:15.77 ID:1KgknxKx0
- 今のAIって語彙力ないと使えなくね?
もっと具体的に言えみたいに言ってくるのウゼー
AIなら俺の心情もっと察しろよ - 38 : 2026/01/27(火) 20:14:18.53 ID:b6hTxRQ70
- でも天安門って入力した地点でなんかされるんだろ?
中国企業の最新AI、完成。ChatGPT・Geminiの最新モデルとほぼ同格のスコアを叩き出す
嫌儲

コメント