#オープンソース
50 件の記事
5月6日
Open ASR Leaderboard、ベンチマーク対策に非公開データ導入
- •Hugging Faceが音声認識評価を刷新
- •非公開データセットで過学習を防止
- •モデルの真の汎化性能を測定可能に
続きを読む →
5月3日
XiaomiのMiMoがClaude Opusに迫る性能
- •Claude Opus 4.6に匹敵する中国製AIモデル登場
- •トークン40〜60%削減で同等のコーディング性能
- •中国勢のオープンウェイトAI競争が激化
4月30日
UbuntuのAI機能追加にLinuxユーザーが反発
- •CanonicalがUbuntuへのAI機能追加を発表
- •ユーザーがAI無効化スイッチの実装を要求
- •Windows 11のAI統合と同様の反発が拡大
続きを読む →
4月30日
IBM Granite 4.1の構築手法を解説
- •IBMがGranite 4.1 LLMの構築手法を公開
- •学習データ・アーキテクチャ・チューニング詳細
- •Apache 2.0で商用利用可能なオープンソース
4月29日
NVIDIA Nemotron 3 Nano Omniを発表
- •NVIDIAが長文脈マルチモーダルモデルを公開
- •文書・音声・動画を統合処理するエージェント向け
- •HuggingFaceで公開、軽量設計でオンデバイス対応
4月29日
1930年以前のデータのみで学習したLLM「Talkie」
- •1931年以前のテキストのみで学習した13B LLM
- •2026年を汽船・鉄道の世界と想像する
- •第二次大戦すら知らない「別の2026年」を描く
4月27日
OpenAI、Symphonyオーケストレーション仕様を公開
- •OpenAIがCodex向けOSS仕様Symphonyを公開
- •イシュートラッカーをエージェント自動化の起点に
- •エンジニアの生産性向上とコンテキスト削減が目標
4月25日
ComfyUIが評価額5億ドルで3000万ドル調達
- •ComfyUIが評価額5億ドルで3000万ドル調達
- •AI画像・動画・音声生成のクリエイター向けツール
- •クリエイターの制御ニーズの高まりが追い風
4月24日
DeepSeek V4プレビュー公開、米大手に対抗
- •DeepSeekが次世代モデルV4のプレビューを公開
- •オープンソースで米大手クローズドモデルと競合
- •コーディング能力が前世代から大幅に向上
4月24日
GoogleがDESIGN.mdをオープンソース化
- •GoogleがDESIGN.md形式をオープンソースで公開
- •AIエージェントがブランドルールを習得可能に
- •AIデザインツールStitchのプロンプトが基盤
4月23日
OpenAIがテキストの個人情報を除去するOSSモデルを公開
- •OpenAIがPrivacy Filterをオープンソースで公開
- •テキスト中の個人情報を検出・削除するモデル
- •企業のデータ匿名化処理に活用可能
続きを読む →
4月23日
Transformers.jsをChrome拡張機能に組み込む方法
- •Transformers.jsをChrome拡張で動かす実装方法を解説
- •Service Worker内でMLモデルをローカル実行可能
- •外部APIなしでAI機能をブラウザ拡張に組み込める
続きを読む →
4月23日
Gemma 4 VLAをエッジデバイスでオフライン実行
- •Gemma 4 VLAがJetson Orin Nano Superで動作
- •音声・カメラを自律的に使い分けるAIエージェント
- •8GBエッジデバイスでクラウド不要のローカル実行
4月22日
GMO PepaboがAIエージェントクラウドサービス開始
- •GMO PepaboがAIエージェント向けクラウドを提供開始
- •Slack・Discord・Telegramとの連携に対応
- •OpenClawも利用可能でエージェント構築を支援
4月21日
AIセキュリティはオープン性が鍵とHugging Face
- •Hugging FaceがAI×セキュリティのオープン性を主張
- •閉鎖的AIは単一障害点リスクを高めると警告
- •半自律型エージェントと人間承認の組み合わせを推奨
続きを読む →
4月21日
TII UAE、Arabic LLM評価「QIMMA」公開
- •アラビア語LLM向け品質重視のランキング公開
- •TII UAEがHuggingFaceで評価基盤を提供
- •アラビア語AI開発の標準化を目指す取り組み
4月21日
NVIDIA Nemotronで韓国語AIエージェントを人口統計に基づいて構築
- •合成ペルソナで韓国語AIを人口統計に接地
- •NVIDIAのNemotronモデルを活用した手法
- •少数言語対応エージェント開発の参考事例
4月21日
Kimi K2.6がGPT-5.4・Claude Opus 4.6に挑む
- •Moonshot AIがKimi K2.6をオープンウェイトで公開
- •コーディング性能でGPT-5.4・Opus 4.6と同水準
- •最大300エージェントの並列実行に対応
4月19日
GoogleがAIエージェント向けUI生成標準A2UIを公開
- •GoogleがAIエージェント用UI標準A2UI 0.9を発表
- •既存コンポーネントをAIが動的に生成・活用
- •Web・モバイルでフレームワーク非依存に対応
4月18日
Claude Mythos優位性に疑問符、小型モデルが追随
- •小規模モデルがClaude Mythosに追随
- •2研究がサイバーセキュリティ能力の差を示す
- •Anthropicの独占優位性に疑問が浮上
続きを読む →
4月18日
Alibaba Qwen3.6がGemma 4を上回るコーディング性能
- •Alibaba Qwen3.6が主要ベンチマークでGemma 4超え
- •350億パラメータ中30億のみを選択的に活性化
- •オープンソースで実用的なコーディング性能を実現
4月18日
NVIDIA、多言語対応高速OCRモデルNemotron OCR v2公開
- •NVIDIAが多言語OCRモデルNemotron OCR v2を公開
- •合成データで高速・高精度なOCRを実現
- •HuggingFaceで無償公開、商用利用も可能