#研究・論文
50 件の記事
1日前
Hugging Face、モデルページに全評価結果を掲載
- •Hugging Faceがモデルページに評価結果を統合表示
- •コミュニティ収集の全評価データを一元参照可能に
- •モデル選定の透明性と比較効率が向上
続きを読む →
16時間前
IBM、Java移行AIエージェントのベンチマーク公開
- •IBMがJava移行AIエージェント評価基準を発表
- •フレームワーク移行の自動化能力を定量測定
- •エンタープライズコードのモダナイゼーション支援
1日前
NTT・近畿大学病院ら4者、LLMで治験患者抽出研究開始
- •NTT・近畿大ら4者が6月から共同研究を開始
- •LLMで治験候補患者の抽出精度と効率を検証
- •実臨床データで患者募集プロセスの自動化を目指す
2日前
Anthropicが企業向けAIエージェントガイド公開
- •Anthropicが企業向けAIエージェント構築ガイドを公開
- •楽天はAIエージェントでコスト・遅延を30%削減
- •単発質問型活用と継続統合型で競争力に大差
2日前
Z.ai、GLM-5.2でMythosに匹敵するサイバー性能
- •中国Z.aiがGLM-5.2をオープンウェイトで公開
- •サイバーセキュリティでMythosに匹敵と研究者
- •米政府、中国の技術追い上げに懸念を強める
続きを読む →
3日前
VibeThinker-3B: 推論は小型モデルに圧縮可能
- •3Bモデルが333倍大きいモデルの推論精度に匹敵
- •多段階ポストトレーニングで性能を引き出す手法
- •推論は圧縮可能・知識は圧縮困難という新仮説
4日前
ByteDance、拡散型言語モデルiLLaDA公開
- •ByteDanceが拡散型言語モデルiLLaDAを発表
- •ベース性能はQwen2.5と同水準の8Bモデル
- •ファインチューニング後は性能差が残る
4日前
MirrorCodeでClaude Opus 4.7が首位
- •Epoch AIがMirrorCodeベンチマークを公開
- •Claude Opus 4.7が56%の解決率でトップ
- •複雑タスクで19日稼働・2600ドルのケースも
5日前
AllenAI: ハイブリッドモデルの得意トークン
- •AllenAI、両モデルの予測優位トークンを特定
- •内容語でHybrid、繰り返し表現でTransformerが優位
- •トークン単位の評価でアーキテクチャ差が可視化
6日前
富士通、Transformer比475倍のPHOTON開発
- •富士通がLLM新アーキテクチャ「PHOTON」を開発
- •Transformer比で最大475倍のGPUスループット
- •LLM運用に必要なGPU数を大幅削減できる
6月23日
Transformers.jsでモデルキャッシュ共有実験
- •ブラウザ間でAIモデルを共有キャッシュ化
- •Cross-Origin Storage APIを試験実装
- •同一モデルの重複ダウンロードを解消へ
続きを読む →
6月22日
Sakana AI、複数モデル集合知のFugu発表
- •Sakana AIが集合知型AIシステムFuguを提供開始
- •複数モデル統合で一部ミュトスを超える性能を実現
- •アンサンブル手法で大規模単一モデルへの依存を低減
6月19日
LLMのボトルネック突破を主張する新興企業登場
- •LLMの二次関数的計算ボトルネック解決と主張
- •Subquadraticがステルス解除し大型クレームを発表
- •BCIの臨床試験急拡大も同ニュースレターで報道
6月19日
Subquadratic、LLMボトルネック解決を主張
- •LLMを10年阻む数学的ボトルネックを解決と主張
- •マイアミ発スタートアップが先月ステルスから登場
- •懐疑的反応の中、証拠データの公開を開始
6月19日
MosaicLeaks: 調査エージェントの情報漏洩
- •ServiceNowが研究エージェントの漏洩リスクを検証
- •機密情報が外部ツール呼び出し時に漏れる
- •業務AI導入企業へのセキュリティ指針を提示
続きを読む →
6月18日
LoRAを超えるか?PEFT手法を実証比較
- •Hugging FaceがLoRAと代替手法を実証比較
- •DoRA・VeRAなど複数手法の性能・効率を検証
- •用途別の最適ファインチューニング手法を整理
続きを読む →
6月18日
AIコーディング5年の急進化をNTT開発者が分析
- •AIコーディングが5年で競プロレベルに急成長
- •NTT開発者がInterop Tokyo 2026で急進化の背景解説
- •急速な進化を支えた技術的背景を分析