News in Focus

TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

  1. 2026年5月29日

    カタストロフィック・フォーゲッティングの機序的起源:RLがSFTよりも回路をよく保持する理由

    大規模言語モデル(LLM)のファインチューニングはしばしば以前の能力のカタストロフィック・フォーゲッティングを引き起こす。最近の研究によれば、強化学習(RL)は教師あり学習(SFT)よりも効果的に以前の能力を保持し、ポリシー勾配更新がより近い状態に留まることに起因している。

    arXiv cs.LG

  2. 2026年5月29日

    ソフトからハードなLLMプロンプトへの翻訳学習

    ソフトプロンプトチューニングはLLMを特定のタスクに適応させるためのパラメータ効率的な方法ですが、解釈可能性の欠如に悩んでいます。ソフトプロンプトの解釈に関する最近の研究に基づいて、専用のソフトプロンプトから自然言語翻訳モデルへのトレーニング方法を探索します。

    arXiv cs.CL

  3. 2026年5月29日

    【みんなのFX】「最大10万円が当たる!夏のプレゼントキャンペーン」を開催!

    みんなのFXが最大10万円の景品を用意した夏のプレゼントキャンペーンを開催します。このキャンペーンは新規顧客獲得を目的とした施策で、FX業界全体が競争激化と顧客基盤の確保に注力していることを示しています。ただしFX取引は高リスク商品であり、金銭的インセンティブで参入ハードルを下げることで、投資経験が浅い層の損失増加につながる可能性も指摘されています。金融庁も虚偽広告や過度なリスク煽動への監視を強化しており、業界には短期的な顧客獲得から中長期的な顧客価値向上への転換が求められています。

    PR TIMES

  4. 2026年5月30日

    スマホケースをカスタムする大人気の「ビジューリボンチャームシール」に待望の新色が登場!オーロラやブルーなど全10色のラインナップへ

    スマホケースをカスタマイズする人気商品「ビジューリボンチャームシール」に、オーロラやブルーなど全10色の新色が追加されました。スマートフォンが自分らしさを表現するツールへと変わる中、SNSの浸透により「ケースをどう見せるか」がファッション同様に重要になっています。貼ってはがせるシール形式なら気分や季節に合わせて手軽にイメージチェンジでき、購入のハードルも低いため、より多くの人がカスタマイズに参加しやすくなります。この動きは、消費者の「パーソナライズしたい欲求」が十分な市場規模に達したことを示す象徴的な事例です。

    PR TIMES

  5. 2026年6月1日

    バランス型安全性アライメントのための設定可能なリワードモデル

    arXiv:2605.30487v1。大規模言語モデル(LLM)を異種かつ急速に進化する安全性要件に整合させることは重大な課題。既存の命令チューニング型LLMとスタンドアローン安全性分類器は新しい安全性設定への一般化に失敗することが多く、外部的に設定可能なリワードモデル(RM)の必要性が生じている。

    arXiv cs.CL

  6. 2026年6月1日

    大規模言語モデルの逐次的なポスト学習における表現の崩壊

    大規模言語モデルは現在、単一の命令チューニングパスではなく、一連のポスト学習段階を通じて適応されています。本論文は、こうした逐次的なポスト学習が内部表現を低ランク、異方性、均質な特徴空間へと徐々に圧縮するかどうかを検討しています。

    arXiv cs.LG

  7. 2026年6月2日

    パラメータ整列は多言語エキスパート言語モデルにおける壊滅的忘却を軽減する

    継続事前学習(CPT)は大規模言語モデルを新しい言語に拡張する実用的な方法ですが、ナイーブなファインチューニングは壊滅的忘却を通じて既存の能力を低下させます。言語ファミリー周辺のトレーニングを組織することはクロスランゲージ干渉を減らしますが、それだけでは十分ではありません。

    arXiv cs.CL

  8. 2026年6月2日

    ChurnNet:顧客離脱予測向けの最適化された最新AI

    競争の激化と小売業者が提供する製品・サービスの類似性の増加により、顧客が競合他社に乗り換えるハードルが低下しています。正確な顧客離脱予測は、効果的なパーソナライズドマーケティングキャンペーン推進と顧客離脱削減に有用なツールとなります。

    arXiv cs.LG

  9. 2026年6月2日

    一般化レイリー商最適化による基盤保護適応

    ファインチューニングはファンデーションモデルを特殊化されたダウンストリームタスクに効果的に適応させますが、事前学習中に獲得した非対象の能力を低下させる可能性があります。既存の忘却認識方法は、通常、特殊な初期化または固定制約を通じて安全な更新を求めていますが、適応の規制は行いません。

    arXiv cs.LG

  10. 2026年6月3日

    Amazon Nova Forgeでのハイパーパラメータ最適化の技術と科学

    ドメイン固有のタスク用のファインチューニングは、一つの領域でのパフォーマンス向上をモデルの一般的な能力の低下なしに実現することを意味しており、このバランスを正しく取ることは見た目以上に難しいものです。

    AWS Machine Learning Blog

  11. 2026年6月3日

    ウォーシュ新FRB議長は利下げに動けるのか?「緩和バイアス」批判の理事・連銀総裁の存在もハードルに - 経済分析の哲人が斬る!市場トピックの深層

    ケビン・ウォーシュ氏がFRB(米連邦準備制度理事会)議長に就任した。宣誓式はホワイトハウスで行われ、トランプ大統領も出席する異例の船出となった。利下げを求める政権の圧力、FOMC内の勢力分布、AIによる生産性向上論、そして根強いインフレ圧力。新議長の政策運営は、早くも難路に直面している。

    ダイヤモンド・オンライン

  12. 2026年6月4日

    Amazon SageMaker AIでSFTとDPOを活用したエージェントのツール呼び出し精度向上

    Amazon SageMaker AIのトレーニング機能を活用し、小規模言語モデルのツール呼び出し精度を改善する新たな手法が注目されている。教師ありファインチューニング(SFT)と直接選好最適化(DPO)を組み合わせることで、モデルがAPI呼び出しやツール操作をより正確に実行できるようになるという。 この手法の利点は、インフラ管理の負担を軽減し、エンジニアがトレーニングコード開発に集中できる点にある。ベースモデルと複数のファインチューニング版を並行で評価・比較することで、最適なモデルを客観的に選定できる。こうしたデータ駆動型アプローチにより、試行錯誤を効率化しながら精度向上を目指せるとされている。 生成AIの実用化が進む中、小規模言語モデルの性能向上は、エッジデバイスやコスト効率の観点から重要な課題である。この技術により、より多くの企業がAIエージェントの導入を検討できる環境が整いつつある。 (AWS Machine Learning Blog)

  13. 2026年6月4日

    Nemotron 3.5 ASRを言語・分野・アクセントに合わせてファインチューニングする方法

    # 独自記事 NVIDIAの音声認識モデル「Nemotron 3.5 ASR」に関して、Hugging Faceは特定の用途に応じたカスタマイズ手法を公開した。このモデルは言語や業界分野、アクセントといった多様なニーズに対応できるファインチューニング機能を備えている。 医療や金融といった専門分野での利用を想定したカスタマイズや、特定の地域特有のアクセント認識の改善など、ユースケースに応じた調整が可能だ。ファインチューニングを実施することで、デフォルト設定では対応が難しい環境での音声認識精度を向上させられる。 企業や研究機関がNemotron 3.5 ASRを導入する際、自社の業務環境や対象ユーザーの言語背景に合わせた最適化を図ることで、より正確な認識性能を実現できる見通しだ。この取り組みは、AIモデルの実用性を高める重要なステップとなる。 (引用元:Hugging Face)

    Hugging Face

  14. 2026年6月5日

    7月の会期末へ国旗損壊、定数削減法案が焦点に…野党抵抗必至 少数与党の参院がハードル

    5日の令和8年度補正予算成立を受け、特別国会の焦点は高市早苗政権が重要視する法案審議に移る。首相肝煎りの「日本国国章損壊罪」法案や日本維新の会が重視する衆院議員定数削減法案などは野党の抵抗が予想され、自民党は7月の会期末に向けて難しい対応を迫られる。

    産経新聞

  15. 2026年6月8日

    SafeGene: 転送可能な安全性アライメントのための再利用可能なアダプター

    オープンウェイトLLMは、カスタマイズされたアシスタントへのファインチューニングが増加していますが、下流のファインチューニングにより安全性アライメントが弱まり、訓練データが意図的に有害でない場合でも、モデルが悪質なプロンプトに対して脆弱になる可能性があります。ターゲットモデルが新しいタスクデータやユーザーインタラクションで繰り返し更新されるため、反復的な安全性回復の問題が生じます。本論文では、各アーキテクチャ互換モデルファミリー内での横断的再利用のために設計された再利用可能な安全性アダプターモジュール「SafeGene」を提案します。安全性回復をモデル固有の修復ステップとして扱う代わりに、SafeGeneは安全性能力をタスク固有の更新から分離された独立した再利用可能なアダプター表現として扱います。この表現は、アラインされた-劣化したモデルの差分から取得され、データに対応したレイヤー選択を通じてタスク転送可能な安全性ベクトルに精密化され、各下流タスク適応モデルで少数ショットレイヤー単位の係数再キャリブレーションを通じて表現されます。

    arXiv cs.AI

  16. 2026年6月8日

    HKJudge:香港判決文の法的言説注釈付きコーパス - 裁判所の判断根拠、推論過程、判決内容の解釈

    本研究は、香港の判決文に対する言説分析のための初めての専門家注釈付き法的言説コーパス「香港判決文言説データセット(HKJudge)」を紹介する。HKJudgeは香港の5段階の裁判所階級全体にわたる刑事判決を含み、約29万文、650万トークンから構成され、法言語学の専門家により完全に注釈付けされている。2層構造の言説スキーマを設計し、裁判所が認定した事実、推論過程、判決内容を捉える。文レベルでは各文に26の修辞的役割のいずれかが割り当てられ、スパンレベルでは有罪判決要素(罪状、懲役期間、罰金)でさらに注釈付けされている。10人の法言語学注釈者によるアノテーションは高い一致度(κ = 0.8)を達成している。HKJudgeに対して修辞的役割分類と法的要素抽出の2つのタスクを定式化し、4つのBERTベースモデル、2つのオープンソースLLM(ゼロショットおよびファインチューニング設定)、および4つの商用LLMについて初の基準評価を提供している。この研究は、文レベルの言説注釈が香港判決文の構造モデリングに価値があることを実証し、法的判決予測に関する将来の研究のための豊富なデータ基盤を提供する。

    arXiv cs.CL

  17. 2026年6月8日

    雇用市場が堅調で物価圧力が続く中、FRBの利上げハードルが低下

    Schwab Center for Financial Researchのコリン・マーティンによると、堅調な雇用市場が物価圧力の上昇に直面する中で、Federal Reserve(FRB)の利上げを実施するためのハードルが低下しているとみられている。

    Bloomberg

  18. 2026年6月9日

    「次世代Apple Intelligence」をフル活用するにはどのような条件がある? 「Siri AI」は日本で使える? 知っておくべき対応モデルのハードル(ITmedia PC USER)

    Appleは6月8日(現地時間)、開発者向けのイベント「WWDC26」の基調講演で最新のApple Foundation ModelをAppleのプラットフォームに深く統合した「次世代Apple I

    Yahoo!ニュース IT

  19. 2026年6月9日

    [ITmedia PC USER] 「次世代Apple Intelligence」をフル活用するにはどのような条件がある? 「Siri AI」は日本で使える? 知っておくべき対応モデルのハードル

    Appleは開発者向けイベント「WWDC26」にて、最新のApple Foundation Modelを各プラットフォームに統合した「次世代Apple Intelligence」を発表した。WWDC26で明かされた最新AI事情の“要点”をチェックしよう。

    ITmedia 全カテゴリ

  20. 2026年6月9日

    中朝、貿易拡大に高いハードル 国連制裁が重荷に

    【北京時事】中国と北朝鮮の貿易が拡大している。2025年の貿易総額は前年比25.5%増の27億3500万ドル(約4400億円)と、6年ぶりに27億ドル台を突破。ただ、北朝鮮への国連制裁は続いており、貿易のさらなる拡大に向けたハードルは高い。

    時事通信

  21. 2026年6月9日

    JPMorgan Chase、今年さらに強力なAIエージェントを導入へ

    JPMorgan Chaseのこの動きは、長年開発されてきたAIエージェントが、大企業内での導入を遅らせてきたセキュリティとガバナンスのハードルをクリアする寸前であることを示唆しています。

    CNBC Business

  22. 2026年6月10日

    合成根拠データを用いた教師ありファインチューニングは、現実世界の疾患予測を損なう

    arXiv:2606.10279v1 発表タイプ: new 要旨:合成根拠データを用いた教師ありファインチューニング(SFT)は、モデルに予測対象だけでなくその理由も教えることで、臨床予測タスクにおける言語モデルの性能を向上させると広く考えられている。我々は、この仮説を、長期的な健康履歴からの5年間のアルツハイマー病および関連認知症(ADRD)予測について検証する。504の構成における大規模な制御実験を通じて、根拠ベースのSFTは、ラベルのみのファインチューニングと比較して、予測性能を一貫して大幅に損なうことがわかった。この低下は、モデルファミリーやデータ規模にわたらず持続し、推論指向のベースモデルを使用しても解決されない。重要なのは、この失敗は根拠の質の低さでは説明されないことである。人間の専門家による注釈は、生成された根拠が医学的に正確であり、患者固有の証拠に忠実に根ざしていることを確認しており、Few-shot実験は、同じ根拠がトレーニングターゲットとしてではなく推論時のデモンストレーションとして使用された場合に性能を向上させることを示している。

    arXiv cs.AI

  23. 2026年6月10日

    KVキャッシュ量子化によるアライメント崩壊:診断と緩和

    arXiv:2606.09864v1 新規発表 論文要旨:キーバリュ(KV)キャッシュ量子化は、大規模言語モデル(LLM)の推論メモリを削減するために広く利用されていますが、既存の評価は、安全性への影響を評価することなく、パープレキシティと精度のみを測定することに焦点を当てています。本研究では、KVキャッシュ量子化下でのアライメント(整合性)の維持を探求します。11の命令チューニング済みモデル(3.8B-72B)と5つのベンチマーク(1,894プロンプト)にわたる調査で、低ビット量子化が安全なアライメントを静かに破壊しうることを発見しました。具体的には、Mistral-7Bはパープレキシティ1.03倍のわずかな増加で拒否率が15.2%失われ、普遍的な安全なビット幅は存在せず、標準的な指標では見えない鋭いモデル固有の位相遷移が見られました。根本原因は幾何学的なものであることを特定しました。安全機能は、パープレキシティの全体表現空間平均よりも10^2〜10^3倍量子化ノイズに弱い低次元アクティベーションサブスペースを占めています。

    arXiv cs.LG

  24. 2026年6月11日

    カーネルの手動チューニングは不要に:Neuron Agentic DevelopmentによるAWS Trainium最適化の加速

    本日、Neuron Agentic Developmentの機能群を発表します。これは、AWS TrainiumおよびAWS Inferentia上で開発を行う開発者向けに、AIエージェントとスキルを集めたものです。本稿では、Neuron Agentic Developmentの機能群がカーネル開発ワークフローをどのように加速するかを説明します。

    AWS Machine Learning Blog

  25. 2026年6月11日

    【SNS年齢確認】厳格化へ、豪州は「16歳未満の利用禁止」で問題続出…実効性ある安全な仕組みを阻む《4つのハードル》 | ビジネス | 東洋経済オンライン

    青少年によるSNS利用が社会問題となる中、各国で年齢確認強化など利用制限の法整備が進んでいます。日本でも未成年のトラブル増加や犯罪被害の深刻化を受け、制度見直しが急務となっています。一律規制の限界や…

    東洋経済オンライン

  26. 2026年6月11日

    【陸上】サープ12秒75の世界新!!男子110mH史上初の12秒7台突入!オーバーン大の20歳が予選で激走/全米学生選手権(月刊陸上競技)

    第104回全米学生選手権(6月10日~13日/現地時間)の1日目がオレゴン州ユージンのヘイワード・フィールドで行われ、男子110mハードル予選でジャコービー・サープ(オーバーン大)が世界初の12秒7台

    Yahoo!ニュース スポーツ

  27. 2026年6月11日

    大規模言語モデルのための互換性認識型動的ファインチューニング

    arXiv:2606.11206v1 新規投稿 概要:教師ありファインチューニング(SFT)は、大規模言語モデル(LLM)の調整における主要なパラダイムですが、最適化の不安定性と限定的な汎化性能に悩まされています。最近の研究では、この問題を病的な勾配スケーリングに起因するものとし、トークンレベルでそれを修正するために動的ファインチューニング(DFT)を提案しています。しかし、DFTはすべてのデモンストレーションが同等に適切な学習ターゲットであると仮定しますが、大規模な命令データセットの強い異質性により、デモンストレーションとポリシーの不一致がサンプルレベルで高分散の更新を引き起こすため、この仮定は破られます。本稿では、サンプルレベルの最適化分散を制御するDFTの原理的な拡張である、互換性認識型動的ファインチューニング(CADFT)を導入します。CADFTは、モデルの尤度から動的でポリシー依存の互換性信号を導出し、教師あり更新を調整して、互換性のないデモンストレーションからの高分散勾配を抑制します。

    arXiv cs.CL

  28. 2026年6月12日

    Amazon Bedrock Data Automationにおけるブループリント抽出精度の最適化

    ブループリント命令の最適化は、この課題に直接対処するために抽出命令を自動的に洗練するBDA(Bedrock Data Automation)の機能です。期待される値を持つ3〜10個のサンプルドキュメントを提供すると、BDAは数分で、数週間ではなく、精度を向上させるためにブループリント命令を洗練します。個別のモデルファインチューニングは不要です。

    AWS Machine Learning Blog

  29. 2026年6月12日

    検索拡張型強化学習ファインチューニングによる類推学習

    自然言語処理分野において、言語モデルの推論能力向上に新たなアプローチが提案されました。従来の検索拡張生成(RAG)は、外部知識を基盤とすることで言語モデルの精度を高める標準的な手法ですが、複雑な推論を要するタスクへの適用には課題がありました。 この課題に対し、研究者らは「検索拡張型強化学習ファインチューニング(RA-RFT)」という訓練後フレームワークを開発しました。RA-RFTは、言語モデルが類推思考によって推論を行うことを可能にするものです。具体的には、まず推論の有効性に基づいて関連情報を評価し、その順位付けを行うリトリーバー(情報検索器)を訓練します。その後、強化学習を用いてポリシーモデルをファインチューニングすることで、モデル全体の推論能力を向上させます。 この新フレームワークにより、言語モデルは単に情報を参照するだけでなく、類推を通じてより高度な問題解決を行う可能性を秘めています。今後の研究や応用が期待されます。 引用元: arXiv cs.CL

    arXiv cs.CL

  30. 2026年6月12日

    ASUS ROGの開放型ゲーミングヘッドセット「ROG Kithara」が発売、4.4mmバランス接続などに対応(AKIBA PC Hotline!)

    ASUS ROGの開放型ゲーミングヘッドセット「ROG Kithara」が発売された。フルバンド対応のMEMSブームマイクも備える。 店頭価格は53,980円。 ■ ROG専用チューニングの1

    Yahoo!ニュース IT