TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

2026年5月8日
GitHub エージェンティック・ワークフローのトークン効率を改善する
すべてのプルリクエストで実行されるエージェンティック・ワークフローは、API請求額を静かに積み重ねることができます。本記事では、独自の本番環境ワークフローを計測し、非効率性を見つけ、それらを修正するエージェントを構築した方法について説明します。
GitHub Blog (AI)
2026年5月19日
NVIDIACEOジェンセン・フアンがDell Technologies World：「需要は放物線を描いて増加しており、全く放物線的です」
NVIDIAベラ・ルービンNVL72による1トークンあたり10分の1のコストでのエージェンティックAI推論。エージェント・サンドボックスはNVIDIAベラで従来のCPUより50%高速に実行され、エンタープライズデータクエリは最大3倍高速です。
NVIDIA Blog
2026年5月19日
EpiCache: リソース制約のある環境での長期会話向けのエピソード的KVキャッシュ管理
最新の大規模言語モデル（LLM）は、コンテキスト長を数百万トークンまで拡張し、長い会話履歴に基づいた一貫性のあるパーソナライズされた応答を実現しています。しかし、キー・バリュー（KV）キャッシュが...
Apple Machine Learning Research
2026年5月21日
グーグルがOpenAIを抜き、消費者向けAIの王座を奪う
しかし、ユーザーは毎月数十億のトークンを消費しており、コスト面での課題が浮き彫りになっている
The Economist Business
2026年5月28日
AI ファクトリー：インテリジェンスの新しいインフラストラクチャ
AIファクトリーはトークンファクトリーであり、電力をリアルタイムでインテリジェンスに変換しています。エージェンシャルAIがスケーリングし、自律的で常時稼働する特別なエージェントがエンタープライズに配備されると、ワットあたりのパフォーマンスは...
NVIDIA Blog
2026年5月29日
金や石油と同じく、間もなくAIトークン先物を取引できるようになる
大手取引所はAIトークンを中心とした派生商品を設計している。AIトークンは、計算上の産出物というより、むしろ原材料として見なされることが増えている。
TechCrunch
2026年5月29日
言語優先性の脱却: モダリティ認識ポリシー最適化によるオーディオ推論の後期段階モダリティ崩壊の軽減
オーディオと全モダリティ大規模言語モデルは印象的なクロスモーダル推論能力を示すが、これらのモデルに標準的な強化学習後処理アルゴリズムを適用すると、GRPO のような方法がすべてのトークンに均一なポリシー勾配を適用する構造的脆弱性が露呈する。
arXiv cs.CL
2026年5月29日
ペーパーエージェント、ペーパーゲイン: DeFi投資エージェントの実証分析
オンチェーン自動取引にAIを使用するDeFi投資エージェントは、2024年後半以来、合計30億米ドルを超えるトークン評価を達成しています。1,900以上のAIタグ付き暗号プロジェクトを調査し、投資焦点のエージェントにフィルタリングして、戦略にまたがる10の代表的なプロジェクトをキュレーションしました。
arXiv cs.AI
2026年5月29日
連続性と順序性が重要：時系列分析における大規模言語モデルの効果的な利用のための時系列トークンの制約
トークンベースの時系列大規模言語モデル（TS-LLM）は時系列分析と推論の有望な方向として浮かび上がっています。しかし、先行研究は時系列トークンの本質的な連続性と順序性を見落としており、これはモデルパフォーマンスを大幅に制限しています。本論文では、これらの属性を制約することの重要性について述べます。
arXiv cs.LG
2026年5月29日
ReasonOps：LLM推論トレースのオペレータセグメンテーション
大規模推論モデルからの思考の連鎖トレースは数万のトークンに及ぶ可能性がありますが、その内部構造を説明するための語彙が不足しています。思考の連鎖トレースを分析するために開発された以前の方法は、あまりに厳格であるか表現力が不十分であり、領域全体の特徴を捉えられていません。
arXiv cs.AI
2026年5月29日
幻覚削減のための格子上のチェーンベース適応再構成
大規模言語モデルにおけるテスト時の幻覚削減のための確率的フレームワークであるCAROL（Chain-based Adaptive Reconfiguration Over Lattices）を導入します。トークンレベルの不確実性に依存するのではなく、CAROLは生成された結果間の一貫性に基づいて意味的不確実性測度を定義します。
arXiv cs.CL
2026年5月30日
拡散モデルのグラフ-テキスト生成における復号化軌跡分析：最初に復号化されるトークンの考察
マスク付き拡散言語モデルの復号化プロセスを分析した新しい研究が発表された。グラフ-テキスト生成タスクにおいて、同モデルが持つユニークな特性が初めて体系的に調査された。研究によると、マスク付き拡散言語モデルは従来の自己回帰型大規模言語モデルと異なり、反復的な復号化の過程で特定の優先順序に従うことが明らかになった。具体的には、まず実体（エンティティ）を復号化し、その後に関係詞や機能語を復号化し、最終段階で構造トークンを復号化するという順序である。同時に研究では、教師あり微調整がこの自然な復号化戦略を阻害する新たな問題モードを特定した。これに対し、推論時に重みなし修正を行う「ラムダスケーリング構造復号化」という手法を提案。この手法を導入することで、BLEUスコア（翻訳品質の評価指標）が9.4ポイント向上することが確認された。この研究成果は、拡散モデルに基づくテキスト生成技術の精度向上に向けた重要な知見を提供するものとなっている。（出典：arXiv cs.CL）
2026年5月31日
「冗談だ」：GitHub Copilotの新しいトークンベース課金が開発者の間で波紋を呼ぶ
マイクロソフトのGitHub Copilotの黄金期は終わりを迎えたようだ。
TechCrunch
2026年6月1日
Amazonがトークン消費を競うランキングボードを廃止…「トークン消費を目的に、AIを使わないで」
アマゾンは、従業員が作成したAIトーク消費ランキング「KiroRank」が過剰なAI投資を助長する恐れがあるとして、廃止したと明かしました。いま業界では、巨大テック企業内で成果に結びつかない過剰な「AIトークン消費」が経営を圧迫しかねないとして問題視され始めています。
Business Insider Japan
2026年6月1日
COFT：大規模言語モデルにおけるフェアな思考の連鎖推論のための反事実適合デコーディング
arXiv:2605.30641v1 大規模言語モデル(LLM)は、思考の連鎖(CoT)生成中に社会的偏見を明らかにし、増幅する可能性がある。本論文では、デコード時にトークンレベルのフェアネス制御を適用する訓練不要のデコーディング方法であるCOFT（フェアな思考の連鎖）を提案し、分布自由の周辺有効性を保証する。
arXiv cs.CL
2026年6月1日
言語間での推測デコーディング
推測デコーディングは大規模言語モデル（LLM）の推論において重要な要素となり、複数のトークンをドラフト作成し並列検証することで高速な生成を実現している。しかし小規模ドラフトモデルは多言語対応で顕著な性能低下が生じる傾向にある。
arXiv cs.CL
2026年6月2日
AIモデル切り替え基盤のOpenRouter、シリーズBで1億1,300万ドル調達——週あたり約25兆トークンを処理
AI ゲートウェイを提供する OpenRouter は現地時間5月26日、Google 親会社 Alphabet の成長投資ファンド CapitalG が主導するシリーズ B ラウンドで1億1,300万ドルを調達したと発 […]
THE BRIDGE
2026年6月2日
AgentCore GatewayとMCPクライアントを使用したセキュアな認証コードフロー設定
# 記事本文 Amazon Bedrockが、セキュアなAI支援要求の実現に向けて新たな認証方式に対応した。AgentCore GatewayでホストされるMCPサーバーにおいて、OAuth認可コードフローの実装が可能になったもの。この仕組みでは、組織のアイデンティティプロバイダーから発行されたユーザートークンを活用し、各AI支援要求の都度認証を行う。これにより、不正アクセスを防ぎながら、本番環境での利用に適したセキュリティ体制を構築できるようになる。導入企業は既存のIDプロバイダーと連携させることで、複雑な追加設定を最小化しつつ、エンタープライズグレードのセキュリティ要件に対応できる点が特徴。クラウドベースのAI活用が進む中、組織の認証基盤との統合が重要性を増すなか、実用的なソリューションとして注目される。（引用元：AWS Machine Learning Blog）
2026年6月2日
ARCA：トークン信号が退化した場合のアダプタ残差クレジット割当
言語モデルの強化学習におけるトークンレベルのクレジット割当は、通常、ポリシーが完全に訓練可能であるかのように定式化されていますが、実際のLLM-RLパイプラインはパラメータ効率の良い微調整、特にLoRAに依存することが多いです。本論文はこの分離が構造的な失敗モードを隠していることを主張しています。
arXiv cs.LG
2026年6月2日
近未来ガイダンスを通じたオンポリシー蒸留における推論軌跡の橋渡し
オンポリシー蒸留（OPD）は、教師の監督下で自身のポリシーからサンプリングされた軌跡について学生モデルを訓練することで大規模言語モデルの推論を改善します。OPDは軌跡上で動作しますが、その学習シグナルはトークンレベルのままです。高損失トークンを通じて逸脱を特定します。
arXiv cs.CL
2026年6月2日
SENSE: 検索ベースの推測的デコーディングのためのセマンティック埋め込みナビゲーション（ソフトゲート評価付き）
推測的デコーディング（SD）は軽量なドラフトモデルを使用して候補トークンを提案し、ターゲットモデルによって並列で検証することで、大規模言語モデル（LLM）の推論を加速化します。生成品質を損なわないまま実現されます。検索ベースの推測的デコーディング（RSD）はその利点から好まれています。
arXiv cs.CL
2026年6月2日
BitsMoE: MoE LLM量子化のための効率的なスペクトルエネルギー誘導ビット割り当て
Mixture-of-Experts（MoE）大規模言語モデルはスパース専門家活性化を通じてトークンあたりの計算を削減しますが、すべての専門家の重みをメモリに保持する必要があるため、展開はメモリ集約的です。既存のMoE圧縮方法は超低ビット領域での対応に苦労しています。
arXiv cs.LG
2026年6月2日
言語モデルにおける学習前段階の類似現象：遅延文法汎化の追跡
グロッキング（神経ネットワークが訓練データに適合した後に長時間にわたって汎化する現象）は、多くのエポックでの教師あり設定において研究されています。LLM学習前段階は代わりにラベルなしコーパス上の次トークン予測に関与し、データ反復が限定的で明示的な訓練/検証分割がない状況です。
arXiv cs.LG
2026年6月2日
BudgetDraft：スパースKV推測デコーディング用の受け入れ認識マルチビュー訓練
推測デコーディングは、ドラフタが複数のトークンを提案し、検証者が並列で検証することによって、自己回帰デコーディングを高速化します。リソース制約のあるデプロイメントでは、ドラフタはスパースKVキャッシュを使用して、固定KV予算下でのピークGPUメモリとエンドツーエンドレイテンシを制限し、検証者が検証します。
arXiv cs.LG
2026年6月3日
マイクロソフト、クラウド不要のAIモデル実行デバイス「Surface RTX Spark Dev Box」を発表
マイクロソフトが開発者向けデスクトップPC「Surface RTX Spark Dev Box」を発表した。同製品はNvidia製のBlackwell RTXプロセッサと128GBのメモリを搭載し、ローカル環境で大規模AIモデルの実行を実現する。従来、大規模な言語モデルやAIモデルはクラウドサービスを通じて利用されてきた。その際、ユーザーはトークン数に応じた課金が必要であった。新デバイスは120億パラメータを超えるAIモデルをオンプレミスで直接実行できるため、クラウド依存からの脱却を可能にする。これにより開発者はネットワーク接続に左右されず、継続的な利用料を発生させることなくAI開発を進められる。マイクロソフトがクラウドベースの課金モデルへの代替案を提供する形となり、AIアクセスの民主化をさらに推し進める施策として注目される。（引用元：VentureBeat AI）
VentureBeat AI
2026年6月3日
想像的知覚トークンがマルチモーダル言語モデルの空間推理を強化
ビジョン言語モデルの空間推理能力向上に新たなアプローチ人工知能の研究領域で、視覚情報と言語を組み合わせて処理するビジョン言語モデル（VLM）が、直接見えない空間の推理が難しいという課題に対する解決策が提案された。研究者らは「想像的知覚トークン」という手法を開発し、モデルが観察できない領域の情報を補完できるようにした。この手法は、視点が変わった時の物体の位置推測や、障害物で隠れている空間での経路追跡といった3つのタスクで検証されている。研究では約20,000例の新規データセットを構築し、BAGEL骨格と呼ばれるシステムに新手法を組み込んで評価。結果として、従来のテキストベースの推論方法を上回る性能を達成したという。この進歩により、VLMはより複雑な3次元空間の理解へ向けた一歩を踏み出す可能性がある。（arXiv cs.AI）
arXiv cs.AI
2026年6月3日
アリババのQwen3.7-Plusがテキスト・動画・画像入力に対応、1M トークン当たり$0.4/$1.6の低価格だがプロプライエタリ
中国のアリババは、マルチモーダル対応の大規模言語モデル「Qwen3.7-Plus」を発表した。テキストに加え、動画と画像の入力に対応する同モデルは、前世代比で60%のコスト削減を実現し、1Mトークン当たりテキスト入力は0.4ドル、動画・画像入力は1.6ドルの価格設定となっている。一方で、同社は商用利用をAPIおよび「Qwen Chat」を通じた有償ライセンスに限定。プロプライエタリ(非公開)ライセンスでのみ提供する方針を明確にした。これまでオープンソースモデルの提供に注力してきたアリババにとって、戦略的な転換点となる。低コストと高性能を両立させた点は評価される一方、オープンソースを活用するユーザーからの反発が懸念される。（引用元：VentureBeat AI）
VentureBeat AI
2026年6月3日
AIエージェントのトークン代を節約するNetflixのエンジニアが作ったツール「Headroom」について調べてみた - Qiita
Claude CodeなどのAIエージェントを日常的に使っていると、あっという間に制限に引っ掛かることがありませんか？ Netflixのシニアエンジニアがオープンソースとしてリリースした「Headroom」というトークン削減ツールが、数日で 6k stars・400 forks を超えて(2026/…
はてなブックマーク IT
2026年6月3日
SPAのトークン、localStorageに置いていい? OWASP ASVS 5.0で変わった答え
はじめに GMOコネクトの永田です。「SPAのアクセストークン、localStorage に置いていいんでしたっけ?」と聞かれて、「ダメだった気がする」と答えかけて手が止まりました。自分の知識が数年前で止まっていたからです😇 確認したら、答えは変わっていました。OWAS...
Qiita 人気記事
2026年6月4日
HYPE価格が20日で100％上昇──カナダ企業がHyperliquidトレジャリー戦略に400万ドル追加【価格分析】(NADA NEWS)
・HyperliquidのネイティブトークンであるHYPEは、5月15日の上場投資信託（ETF）取引開始から20日でETFへの資金流入額が1億4,000万ドルを超えるなか75ドル超の過去最高値を記録し
Yahoo!ニュース IT