News in Focus

TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

  1. 2026年3月29日

    AI時代のためにマウスポインターを再構想する

    Google DeepMindはマウスポインターをコンテキスト認識型のAIパートナーに進化させています。従来のプロンプト入力の面倒さを超え、Chromeおよびそれ以外でもAIとの直感的なコラボレーションを実現します。

    Google DeepMind

  2. 2026年5月19日

    EpiCache: リソース制約のある環境での長期会話向けのエピソード的KVキャッシュ管理

    最新の大規模言語モデル(LLM)は、コンテキスト長を数百万トークンまで拡張し、長い会話履歴に基づいた一貫性のあるパーソナライズされた応答を実現しています。しかし、キー・バリュー(KV)キャッシュが...

    Apple Machine Learning Research

  3. 2026年5月27日

    Strands Agents、NVIDIA NIM、Amazon Bedrock AgentCoreを使用した高性能生成AIシステムの構築

    このポストでは、統合アーキテクチャを使用して、並列推論、コンテキスト永続性、追跡可能な実行パスを実証するマルチエージェントキャンペーンレビュー システムの構築方法を学ぶことができます。

    AWS Machine Learning Blog

  4. 2026年5月29日

    LCO: LLMベースの制約最適化によるより安全なエージェントLLM実世界タスク対応

    大規模言語モデル(LLM)は自律エージェントとしてますます機能していますが、環境との継続的なインタラクションはコンテキスト内報酬ハッキング(ICRH)につながる可能性があり、これはLLMがプロキシ目標を最大化するために行動を反復的に最適化し、意図しない有害な副作用を生み出す現象です。

    arXiv cs.CL

  5. 2026年5月29日

    潜在メモリ管理としてのコンテキスト蒸留

    コンテキスト蒸留は文脈情報をモデルパラメータに圧縮するが、既存の方法は複数の蒸留された潜在メモリをオラクル以外の設定でどのように保存、検索、安全に活性化するかについて無視することが多い。本研究ではコンテキスト蒸留を潜在メモリ管理問題として定式化する。

    arXiv cs.LG

  6. 2026年5月29日

    カタストロフィック・フォーゲッティングの機序的起源:RLがSFTよりも回路をよく保持する理由

    大規模言語モデル(LLM)のファインチューニングはしばしば以前の能力のカタストロフィック・フォーゲッティングを引き起こす。最近の研究によれば、強化学習(RL)は教師あり学習(SFT)よりも効果的に以前の能力を保持し、ポリシー勾配更新がより近い状態に留まることに起因している。

    arXiv cs.LG

  7. 2026年6月1日

    長期タスク向けエージェント互換コンテキスト管理の学習

    LLMエージェントはウェブサーチや深い研究など現実世界のアプリケーションにおける長期タスクにますます直面しており、蓄積されたコンテキストは長コンテキスト低下と推論失敗を引き起こすことがある。先行研究ではエージェント側のコンテキスト制御または固定戦略によるコンテキスト管理を通じてこれを緩和している。

    arXiv cs.AI

  8. 2026年6月1日

    ElasticMem:LLMエージェント向けの学習可能なリソースとしての潜在メモリ

    arXiv:2605.30690v1 長期メモリはLLMエージェントが拡張インタラクション全体で一貫性のある推論を行い、応答をパーソナライズし、過去の経験を再利用するために不可欠である。しかし既存のメモリ拡張手法は通常、メモリを固定リソースとして扱っている。テキスト空間アプローチは取得したメモリをコンテキストに連結する。

    arXiv cs.CL

  9. 2026年6月2日

    Amazon FSx for LustreのGPUDirectでLLMモデルロードを高速化し、コンテキストウィンドウを拡大

    AWS GPUインスタンスへの大規模言語モデル(LLM)のデプロイを繰り返している場合、GPUのHigh Bandwidth Memory(HBM)にロードするモデルが大きいほど、長い時間がかかることに気付いているでしょう。

    AWS Machine Learning Blog

  10. 2026年6月2日

    Amazon FSx for LustreのGPUDirectでLLMモデル読み込みを高速化し、コンテキストウィンドウを拡大

    AWS環境でLLM(大規模言語モデル)を運用する際の課題に対応する新たな技術アプローチが注目を集めている。GPUインスタンスへのモデル読み込みに要する時間短縮が、これまでの実運用における課題だった。 AWSが提案する解決策は、GPUDirect、Amazon FSx for Lustre、TurboQuantの3つの技術を組み合わせるもの。これらを活用することで、モデルをGPUメモリへ転送する速度を大幅に高速化できる。結果として、より大規模なパラメータ数を持つモデルの推論準備時間が短縮され、LLMが処理可能なテキスト長を示すコンテキストウィンドウの拡大も実現可能となる。 この技術統合により、複雑な推論タスクや長文処理が必要なユースケースでの対応能力が向上する見通しだ。クラウド環境でのAI推論効率化に向けた実装例として、今後の導入が期待されている。 (引用元:AWS Machine Learning Blog)

  11. 2026年6月2日

    パラメータ整列は多言語エキスパート言語モデルにおける壊滅的忘却を軽減する

    継続事前学習(CPT)は大規模言語モデルを新しい言語に拡張する実用的な方法ですが、ナイーブなファインチューニングは壊滅的忘却を通じて既存の能力を低下させます。言語ファミリー周辺のトレーニングを組織することはクロスランゲージ干渉を減らしますが、それだけでは十分ではありません。

    arXiv cs.CL

  12. 2026年6月2日

    モデルネイティブコンピューティングアーキテクチャ: コンピュータアーキテクチャの観点から見た将来のシステムアーキテクチャの構想

    大規模言語モデルはモデル技術からシステム技術への転換期を迎えています。開発者がCodex、Claude Code、AutoGPTおよび関連エージェントを使用してコードを作成し、プロジェクトを管理し、複数ステップのタスクを実行する際に、キャッシュの再利用、コンテキスト管理、エージェントスケーリングなどの反復的なエンジニアリング課題が発生します。

    arXiv cs.AI

  13. 2026年6月2日

    一般化レイリー商最適化による基盤保護適応

    ファインチューニングはファンデーションモデルを特殊化されたダウンストリームタスクに効果的に適応させますが、事前学習中に獲得した非対象の能力を低下させる可能性があります。既存の忘却認識方法は、通常、特殊な初期化または固定制約を通じて安全な更新を求めていますが、適応の規制は行いません。

    arXiv cs.LG

  14. 2026年6月2日

    古い観察をマスキングすることは検索エージェントに役立つ - その時までは:レジームマップとそのメカニズム

    長期間の検索エージェントは多くのツール呼び出しにおいて大量の取得コンテンツを蓄積するため、コンテキスト予算効率がますます重要になります。最小限の介入は軌跡の進行に伴い、コンテキストから古い観察をマスキングすることですが、このタイプのコンテキスト処理がいつ有効であるかは依然として不明です。

    arXiv cs.CL

  15. 2026年6月2日

    ロバストなインコンテキスト学習に向けて: ターゲットにアクセスできないデモンストレーション取得のための分布外プロキシの活用

    大規模言語モデル(LLM)が分布外タスクで良好なパフォーマンスを発揮できることが示されていますが、分布シフトが大きくなるにつれてその利点は減少する傾向があります。そのため、研究者は分布的に類似した情報提供的なデモンストレーションの取得を目指しています。

    arXiv cs.CL

  16. 2026年6月3日

    Amazon Nova Forgeでのハイパーパラメータ最適化の技術と科学

    ドメイン固有のタスク用のファインチューニングは、一つの領域でのパフォーマンス向上をモデルの一般的な能力の低下なしに実現することを意味しており、このバランスを正しく取ることは見た目以上に難しいものです。

    AWS Machine Learning Blog

  17. 2026年6月3日

    Microsoft、企業AI エージェント向けの「Microsoft IQ」と「Rayfin」を発表

    企業が導入するAIエージェント間でのデータの断絶が課題となる中、Microsoftは統合型システム「Microsoft IQ」を発表した。2026年のBuildカンファレンスでの発表となる。 現在、企業内に展開されるAIエージェントは独立した環境で動作し、各々がデータサイロを形成。組織全体で共通のビジネスコンテキストやルール適用が困難な状況にあった。Microsoft IQはこの問題を解決するため、ビジネスデータのコンテキスト層を大幅に拡張する。 同システムは組織の運営方法や蓄積された知識、リアルタイムのグローバルシグナルなど複数のコンテキストソースを統合。これによりAIエージェント間での情報共有が可能となり、組織全体で一貫した判断と動作が実現される。 企業のデジタルトランスフォーメーション推進において、AIエージェント間の連携強化は重要な課題。Microsoftの新システムはエンタープライズAI活用の効率化に貢献すると期待される。 (引用元:VentureBeat AI)

    VentureBeat AI

  18. 2026年6月4日

    Amazon SageMaker AIでSFTとDPOを活用したエージェントのツール呼び出し精度向上

    Amazon SageMaker AIのトレーニング機能を活用し、小規模言語モデルのツール呼び出し精度を改善する新たな手法が注目されている。教師ありファインチューニング(SFT)と直接選好最適化(DPO)を組み合わせることで、モデルがAPI呼び出しやツール操作をより正確に実行できるようになるという。 この手法の利点は、インフラ管理の負担を軽減し、エンジニアがトレーニングコード開発に集中できる点にある。ベースモデルと複数のファインチューニング版を並行で評価・比較することで、最適なモデルを客観的に選定できる。こうしたデータ駆動型アプローチにより、試行錯誤を効率化しながら精度向上を目指せるとされている。 生成AIの実用化が進む中、小規模言語モデルの性能向上は、エッジデバイスやコスト効率の観点から重要な課題である。この技術により、より多くの企業がAIエージェントの導入を検討できる環境が整いつつある。 (AWS Machine Learning Blog)

  19. 2026年6月4日

    Amazon Bedrockでスケーラブルな自動運転AI運用を構築する方法

    このポストでは、Amazon Bedrock Ops Alertを紹介します。これは3層の自動監視ソリューションで、運用上の問題を積極的に検出し、アラームしきい値を動的に調整し、アラームをカテゴリ別に分類し、コンテキストを認識したサポートケースを自動作成し、同じアラームカテゴリの未解決ケースが既にアクティブな場合の重複ケース作成を防止し、AI SREチームへのコンテキスト化された通知を配信します。

    AWS Machine Learning Blog

  20. 2026年6月4日

    オートデスク、主要製品向けにAIアシスタント機能を展開 Fusion向けMCPも

    Autodeskは、主要製品向けに「Autodesk Assistant」のテックプレビュー版を提供する他、Fusion向けのMCPを公開した。設計データや業務コンテキストを理解するAIアシスタントに加え、外部AIとの連携を可能にする機能も提供し、設計/製造業務におけるAI活用の拡大を図る。

    ITmedia AI+

  21. 2026年6月4日

    Nemotron 3.5 ASRを言語・分野・アクセントに合わせてファインチューニングする方法

    # 独自記事 NVIDIAの音声認識モデル「Nemotron 3.5 ASR」に関して、Hugging Faceは特定の用途に応じたカスタマイズ手法を公開した。このモデルは言語や業界分野、アクセントといった多様なニーズに対応できるファインチューニング機能を備えている。 医療や金融といった専門分野での利用を想定したカスタマイズや、特定の地域特有のアクセント認識の改善など、ユースケースに応じた調整が可能だ。ファインチューニングを実施することで、デフォルト設定では対応が難しい環境での音声認識精度を向上させられる。 企業や研究機関がNemotron 3.5 ASRを導入する際、自社の業務環境や対象ユーザーの言語背景に合わせた最適化を図ることで、より正確な認識性能を実現できる見通しだ。この取り組みは、AIモデルの実用性を高める重要なステップとなる。 (引用元:Hugging Face)

    Hugging Face

  22. 2026年6月5日

    Code2LoRA:ソフトウェア進化下のコード言語モデル向けハイパーネットワーク生成アダプタ

    コード生成を支援するAI言語モデルの新たな課題に対する解決策が提案されました。ソフトウェア開発の現場では、特定のコードリポジトリ全体の文脈を踏まえた正確なコード生成が求められていますが、これを実現することは計算効率の面で難しいとされてきました。 研究チームが発表した「Code2LoRA」は、ハイパーネットワーク技術を活用して、リポジトリ固有の知識を言語モデルに効率的に組み込む手法です。この手法は、リポジトリごとにカスタマイズされた軽量なアダプタ(LoRA)を事前に生成し、推論時に追加の計算負荷をかけずに活用できるのが特徴。 提案されるフレームワークは2つのバージョンを備えており、完成されたプロジェクト向けの「Static版」と、開発途上のコードベース向けの「Evo版」に対応。これにより、リポジトリレベルのコンテキストが必要な様々な開発環境での適用が可能になるとしています。 (出典:arXiv cs.CL)

    arXiv cs.CL

  23. 2026年6月5日

    「Windows」の右クリックメニューへの不満、「近いうちに改善」とマイクロソフト(ZDNET Japan)

    「Windows」の「エクスプローラー」内やデスクトップ上で右クリックしたときに表示されるコンテキストメニューは、常に悩みの種であった。従来のWindowsでは、多数の項目が追加されてメニューが際限

    Yahoo!ニュース IT

  24. 2026年6月7日

    AIウォーターフォール開発:コンテキストゼロのAIを一人前にする仕組み

    はじめに Claude Codeを使い始めてすぐ気づいた。セッションを開くたびに、AIは何も知らない状態から始まる。 先週話した仕様変更も、ADRで決めた設計方針も、あの実装が依存している要件も、全部ない。毎回ゼロから説明し直す。

    Zenn

  25. 2026年6月8日

    エージェンティックAIがコーディングを解決した—ソフトウェア工学の他の問題を露出

    エージェンティックAIがもたらす新たな課題 AI技術がコード生成を大幅に加速させたにもかかわらず、企業全体のプロダクト開発速度は期待通りに向上していない状況が明らかになった。 その理由は、ソフトウェア開発における本質的な課題にある。要件定義の策定、複数システムの統合、本番環境での保守運用といった工程は、AIによるコード生成の自動化だけでは解決できない。AIが自動生成したコードの量が増加する一方で、これらコードの品質検証は人間による綿密なレビューに依存しており、ここがボトルネックとなっている。 さらに問題は、大量のAI生成コードに対応する中で、エンジニアが開発の全体像を把握するために必要なコンテキスト情報を失いつつあることだ。細部への対応に追われる結果、システムレベルでの問題検出や改善機会を見逃すリスクが高まっている。 AIによる自動化の進展に伴い、開発プロセスの他の段階における人間の役割と効率性の向上が、今後の課題として浮かび上がった。 (VentureBeat AI)

    VentureBeat AI

  26. 2026年6月8日

    カスタマイズに対応? 不評だったWindows 11の右クリックメニュー、見直し作業が進行中【やじうまWatch】

    Windows 11で右クリックすると表示されるコンテキストメニューの見直し作業が進められていることが明らかになった。

    INTERNET Watch

  27. 2026年6月8日

    SafeGene: 転送可能な安全性アライメントのための再利用可能なアダプター

    オープンウェイトLLMは、カスタマイズされたアシスタントへのファインチューニングが増加していますが、下流のファインチューニングにより安全性アライメントが弱まり、訓練データが意図的に有害でない場合でも、モデルが悪質なプロンプトに対して脆弱になる可能性があります。ターゲットモデルが新しいタスクデータやユーザーインタラクションで繰り返し更新されるため、反復的な安全性回復の問題が生じます。本論文では、各アーキテクチャ互換モデルファミリー内での横断的再利用のために設計された再利用可能な安全性アダプターモジュール「SafeGene」を提案します。安全性回復をモデル固有の修復ステップとして扱う代わりに、SafeGeneは安全性能力をタスク固有の更新から分離された独立した再利用可能なアダプター表現として扱います。この表現は、アラインされた-劣化したモデルの差分から取得され、データに対応したレイヤー選択を通じてタスク転送可能な安全性ベクトルに精密化され、各下流タスク適応モデルで少数ショットレイヤー単位の係数再キャリブレーションを通じて表現されます。

    arXiv cs.AI

  28. 2026年6月8日

    HKJudge:香港判決文の法的言説注釈付きコーパス - 裁判所の判断根拠、推論過程、判決内容の解釈

    本研究は、香港の判決文に対する言説分析のための初めての専門家注釈付き法的言説コーパス「香港判決文言説データセット(HKJudge)」を紹介する。HKJudgeは香港の5段階の裁判所階級全体にわたる刑事判決を含み、約29万文、650万トークンから構成され、法言語学の専門家により完全に注釈付けされている。2層構造の言説スキーマを設計し、裁判所が認定した事実、推論過程、判決内容を捉える。文レベルでは各文に26の修辞的役割のいずれかが割り当てられ、スパンレベルでは有罪判決要素(罪状、懲役期間、罰金)でさらに注釈付けされている。10人の法言語学注釈者によるアノテーションは高い一致度(κ = 0.8)を達成している。HKJudgeに対して修辞的役割分類と法的要素抽出の2つのタスクを定式化し、4つのBERTベースモデル、2つのオープンソースLLM(ゼロショットおよびファインチューニング設定)、および4つの商用LLMについて初の基準評価を提供している。この研究は、文レベルの言説注釈が香港判決文の構造モデリングに価値があることを実証し、法的判決予測に関する将来の研究のための豊富なデータ基盤を提供する。

    arXiv cs.CL

  29. 2026年6月9日

    潜在空間ベイズ最適化におけるコンテキスト内学習

    効率的な設計手法として注目されるベイズ最適化(BO)が、近年、分子やタンパク質といった複雑な構造を持つ物質への応用を広げています。これは、潜在空間ベイズ最適化(LSBO)と呼ばれる技術によって可能になります。 LSBOでは、複雑な構造が抽象的な「潜在空間」に変換され、この空間内で最適な設計が探索されます。現在、データ分析の分野で高い性能を発揮している表形式基盤モデル(TabPFNやTabICLなど)が、BOの代理モデルとして利用されるケースが増加しています。 しかし、これらの基盤モデルをLSBOに適用する際には、特定の課題が存在していました。この課題に対処するため、最新の研究では、分子の構造を符号化する変分オートエンコーダ(VAE)の潜在空間で定義された合成最適化タスクを用いて、表形式基盤モデルの事前学習段階を補強する手法が提案されています。このアプローチにより、LSBOにおけるモデルの不一致が解消され、より効率的で高精度な物質設計への貢献が期待されます。 引用元: arXiv cs.LG

    arXiv cs.LG

  30. 2026年6月9日

    Express言語モデリング

    言語モデルの効率化を目指し、新たなツール「Express」が導入されました。このExpressは、これまで非因果的アテンションの近似に用いられていた手法を、因果的アテンションの近似へと転換させる機能を持ちます。 具体的には、既存の「Thinformer」という近似手法と組み合わせることで、因果的アテンションの近似精度を向上させることが期待されています。これにより、言語モデリングにおいて課題となっていた四つのリソースボトルネックの克服に貢献すると考えられます。これらのボトルネックには、長いコンテキストの事前処理やKVキャッシュの圧縮などが含まれており、Expressの活用によって、より効率的な言語モデルの開発が進む可能性があります。 arXiv cs.LG

    arXiv cs.LG