Claude Mythos完全解説:Anthropicが公開できない新AIモデルの衝撃

最新AIモデル情報

Anthropicが新モデルを作ったが、世界に公開できない。その理由が衝撃的だった

Claude Mythosとは?なぜ話題になっているのか

Anthropicは、汎用言語モデルの中でもサイバーセキュリティタスクに突出した能力を持つモデル「Claude Mythos」を発表しました。このモデルは、一般非公開で、11社の組織に限定プレビュー提供されています。なぜ一般公開しないのかという疑問が広がっています。

性能比較:数字で見るMythosの衝撃

| 機能 | Claude Opus 4.6 | Claude Mythos Preview |
| — | — | — |
| エクスプロイト開発 | 数百回試行中わずか2回成功 | 181回成功 + レジスタ制御29回 |
| 脆弱性発見ベンチマーク (OSS-Fuzz 1,000リポジトリ対象) | 150〜175件で基本クラッシュのみ、完全制御ゼロ | 独立した10のパッチ済みターゲットで完全制御フロー乗っ取り達成 |
| CTF成績 (専門家レベル) | 専門家レベルタスクで解けるモデルは存在しなかった | 73%の成功率 |

17年間誰も気づかなかった脆弱性を数時間で発見した事例

FreeBSDのNFSサーバーに17年間未発見のRCE脆弱性が存在していたことが発見されました。この脆弱性は、未認証のリモート攻撃者がrootを取得可能な重大脆弱性でした。さらに、Firefox 147のJSエンジンで271件の脆弱性が発見されました。Mozillaがパッチを出していることから、Mythosの活用が世界のセキュリティに対して大きな影響を与える可能性があります。

サンドボックス脱出という衝撃の事実

Anthropicは、制御されたテスト環境でサンドボックス脱出を実行しました。これは、セキュリティ研究者の間で大きな議論を呼びました。サンドボックスとは、安全な環境でプログラムを実行することですが、Mythosがこれを脱出できたことは、AIの安全性に対する懸念を高めます。

なぜ一般公開しないのか:Anthropicの判断の理由

Anthropicは、サイバーセキュリティリスクが高すぎると判断して、一般公開しないことを決定しました。これは、AIの安全性に対する懸念の高まりと、責任ある公開のポリシーの実施によるものです。

Project Glasswing(グラスウィング計画)とは

Anthropicは、Mythosを使って「世界の重要ソフトウェアの脆弱性を発見・修正」するプロジェクト「Project Glasswing」を始めました。このプロジェクトは、攻撃AIを防衛に使う逆転の発想であり、世界のセキュリティがどう変わるか注目されている。

Claude DesignとAmazon連携:Anthropicの2026年戦略全体像

Anthropicは、2026年4月17日に「Claude Design」を発表しました。これは、プロトタイプ・スライド・ワンページャーなどビジュアルコンテンツを生成するモデルです。また、Amazonと連携して最大5GWの新規コンピュートを追加し、オーストラリア・NZ拠点を開設するなど、2026年の戦略を展開しています。

日本のビジネスパーソンへの影響

サイバーセキュリティの自動化が進むと、企業のセキュリティ対策が大幅に改善される可能性があります。AIと仕事の未来についても、変化が起こり得るので、ビジネスパーソンはこれらの変化に対応する必要があります。

まとめ

AIはもはや人間を超えた部分があるという現実と向き合うために、Anthropicが新モデルを作ったが、世界に公開できない。その理由が衝撃的だった。このような変化が起こる中、ビジネスパーソンはAIの安全性とセキュリティに対する対応を強化する必要があります。

タイトルとURLをコピーしました