News in Focus

TOPIC TIMELINE

タイムライン検索

特定トピックに関する記事を時系列で並べて「いつ・何が起きたか」を俯瞰します。

  1. 2026年3月23日

    Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能について

    はじめに Preferred Networksの加藤です。AIプロダクト・ソリューションチーム所属で、AutoMLチームも兼務しています。PFNでは Preferred AI という生成AIを活用したプロダクト群を開発し […] 投稿 Optunaベースの内製フレームワーク × Work Suite: ユーザフィードバック駆動型プロンプト最適化を用いた新機能について は Preferr…

    Preferred Networks

  2. 2026年3月29日

    AI時代のためにマウスポインターを再構想する

    Google DeepMindはマウスポインターをコンテキスト認識型のAIパートナーに進化させています。従来のプロンプト入力の面倒さを超え、Chromeおよびそれ以外でもAIとの直感的なコラボレーションを実現します。

    Google DeepMind

  3. 2026年4月18日

    GitHub Copilot CLIを使ってプロンプトジェネレーターを構築する

    Rubber Duck Thursdayストリーム中に作成されたプロンプトジェネレーターの製作過程を紹介します。

    GitHub Blog (AI)

  4. 2026年5月22日

    VSAS-Bench:ビジュアルストリーミングアシスタントモデルのリアルタイム評価

    ストリーミング視覚言語モデル(VLM)は、命令プロンプトとオンラインの入力フレームストリームが与えられるとリアルタイムで応答を生成し続けます。これはリアルタイムビジュアルアシスタントの中核メカニズムです。

    Apple Machine Learning Research

  5. 2026年5月29日

    プロンプトインジェクション攻撃をコードに忍び込ませるプログラマー

    jqwikの未公開の追加機能により、AIコーディングエージェントにアプリ出力の削除を指示するプロンプトが組み込まれていました。

    Ars Technica AI

  6. 2026年5月29日

    ソフトからハードなLLMプロンプトへの翻訳学習

    ソフトプロンプトチューニングはLLMを特定のタスクに適応させるためのパラメータ効率的な方法ですが、解釈可能性の欠如に悩んでいます。ソフトプロンプトの解釈に関する最近の研究に基づいて、専用のソフトプロンプトから自然言語翻訳モデルへのトレーニング方法を探索します。

    arXiv cs.CL

  7. 2026年5月29日

    トーンに気をつけよう:トーンはLLMのパフォーマンスを変えるか?

    大規模言語モデル(LLM)の使用が増加していますが、プロンプトのスタイルとトーンによってパフォーマンスが異なることが観察されています。本研究では、プロンプトのトーンの変動が客観的な多肢選択問題に対するLLMの精度にどのような影響を与えるかを調査しています。

    arXiv cs.AI

  8. 2026年5月29日

    プロンプトベースのテキスト音声変換モデルにおける細粒度および文内話し方スタイル制御の実現

    プロンプトベースのテキスト音声変換(TTS)モデルは自然言語駆動の話し方スタイル制御を実現しますが、多くの場合きめ細かい制御が限定的で、発話全体に単一のグローバルスタイルを適用しています。これは発話全体にわたる継続的なスタイル属性補間を必要とする実用的なユースケースを制限しています。

    arXiv cs.CL

  9. 2026年5月30日

    AI活用で採用工数を月200時間削減した組織改革~Claude全社導入まで、kubellが実践する全社ルール×チーム自律~|6/11(木)・6/18(木)開催

    kubellがClaude全社導入により採用業務の工数を月200時間削減した事例が注目を集めています。同社の成功の鍵は、単なるツール選択ではなく「運用ルール設計」にありました。全社共通のルールを策定しつつ、具体的な運用方法は各チームに委譲するという「統制と自律のバランス」が、利用権限の曖昧さやプロンプト品質のばらつきといった実装段階の課題を排除したと考えられます。この取り組みは生成AI時代における組織設計の新しい在り方を示唆し、「管理と効率」から「創造性と統制のバランス」へのシフトを象徴しています。

    PR TIMES

  10. 2026年6月1日

    モック・ツール・コールを用いた評価による信頼できない入力の隔離

    大規模言語モデルは他のモデルの回答判定やスパム・有害分類器の実行など、敵対的圧力下での信頼できない入力を頻繁に処理する必要があり、これらの入力がプロンプト・テンプレートに直接文字列形式で組み込まれるため、システムは操作に対して脆弱である。

    arXiv cs.CL

  11. 2026年6月1日

    プロンプトKVキャッシュの調査:不要になる場所

    先行するKVキャッシュ圧縮スキームは、デコード中にプロンプトキャッシュが部分的に冗長であることを実証しており、精度損失がほぼなく項目を削除または要約できることが示されている。本研究では、いつ、どのような種類の冗長性が、どのレイヤーで、デコード後何ステップ後に、どのような形式で発生するのかを調査する。

    arXiv cs.CL

  12. 2026年6月1日

    VeriGate:GRPO向け検証器ゲート付きステップレベル監督

    Group Relative Policy Optimization(GRPO)は検証器ベースの結果報酬を用いた推論モデル訓練のための効果的なレシピであるが、その監督は疎である。プロンプトについてサンプリングされたすべての軌跡が同じ検証器報酬を受け取る場合、グループ相対的なアドバンテージはゼロに低下し、学習が停滞する。

    arXiv cs.LG

  13. 2026年6月1日

    ハーネス更新はハーネス利益ではない:自己進化するLLMエージェントの進化能力の解きほぐし

    arXiv:2605.30621v1 発表型:新規 要旨:LLMエージェントは、プロンプト、スキル、メモリ、ツールを含む編集可能な外部ハーネスの周辺に構築されたシステムとしてますますデプロイされており、これらはモデルパラメータを変更することなくタスク実行を形作る。ハーネス自己進化は実行証拠からこれらのハーネスを更新することによってそのようなエージェントを適応させる。しかし...

    arXiv cs.AI

  14. 2026年6月2日

    デモンストレーションから報酬へ:VLM報酬モデルのためのテスト時プロンプト最適化

    強化学習は正確な報酬関数に依存しており、ロボティクスなどの実世界アプリケーションではしばしば手作業で作成されるか利用できません。最近の研究では、事前学習済みビジョン言語モデル(VLM)の零ショット推論能力を報酬モデルとして活用することが検討されていますが、慎重な調整なしに実施することは困難です。

    arXiv cs.LG

  15. 2026年6月3日

    「投資家はAIをもっと活用すべき」。オプショントレーダー直伝、今使うべきAIツールと適切なプロンプト

    継続してS&P500を上回り、経済的自立を果たしたオプション・トレーダーのエリック・スモリンスキーは「AIを使うか、それとも遅れをとるかです」と語り、投資家にAIの使い方を説明しました。

    Business Insider Japan

  16. 2026年6月4日

    Google Chromeの新機能「Skills」 AIプロンプトの“毎回手打ち”を不要に

    Google��Chrome������AI�V�@�\�uSkills in Chrome�v�𔭕\�����BAI�v�����v�g��ۑ����ă����N���b�N�ōė��p�”\�ɂ���Ƃ����B

    ITmedia AI+

  17. 2026年6月4日

    プロンプトのための最強のTeXチートシート

    プロンプトのための最強のTeXチートシート Qiita・ChatGPT・Claude・Gemini などに数式を伝えたい場合、いちいちキーボード変換をしていませんか?もしくは、画像を貼ってトークンを消費していませんか?この記事はそんな悩みを全部解決します。 TeX 記法は...

    Qiita 人気記事

  18. 2026年6月5日

    【現役学生がつづるAIとの生活】「AIにプロンプトを書かせる」のが学生の常識?

    窓の杜創刊30周年記念企画として、現役の大学・大学院生たちが日常の中で生成AIをどう使っているのかを「日記形式」でつづる新連載「現役学生がつづるAIとの生活」がスタートします。

    窓の杜

  19. 2026年6月5日

    Snowflake App Runtime 入門 - プロンプトひとつでデータの隣に本格Webアプリをデプロイする!

    はじめに Snowflake Summit 2026 では、数多くの新機能が発表されました。その中で私が特に注目している機能のひとつが Snowflake App Runtime です。 これまで、こんなもどかしさを感じたことはないでしょうか?

    Zenn

  20. 2026年6月6日

    [ITmedia ビジネスオンライン] プロンプトの時代は終わった OpenAIが実践する「AIが迷わず働く職場」の作り方

    生成AIがコードを書くこと自体は、もはや驚きではなくなった。だが米OpenAIが示しているのは、その次の段階だ。勝負どころは、AIにコードを書かせることではない。AIが安定して働ける開発環境そのものを設計し、AI自身が学習し、改善し続けることにある。

    ITmedia 全カテゴリ

  21. 2026年6月7日

    OpenAIがプロンプトインジェクション攻撃から機密データを保護するロックダウンモードを発表

    ロックダウンモードがあってもChatGPTはプロンプトインジェクションに対して脆弱性を持つ可能性があるが、目標は機密データが共有される可能性を低減することである。

    TechCrunch AI

  22. 2026年6月8日

    AI駆動開発を2コマンドで組織標準に ── Claude Code × Codexで設計からテストまで - ZOZO TECH BLOG

    はじめに こんにちは。基幹システム本部 基幹開発部 商品管理ブロックの田中秀明です。 Claude CodeやCodexの利用が広がるほど、各人の使い方、プロンプト、レビュー観点、AIへ任せる範囲がばらつき始めました。

    はてなブックマーク IT

  23. 2026年6月8日

    設計資料をHTMLで回す — 生成・レビュー・社内共有のワークフロー

    はじめに 社内では最近、HTMLで書いた設計資料を認証付きの基盤に置き、誰でもブラウザから閲覧できる仕組みを整えました。この共有基盤の上で、私がいま個人的に試しているのが、設計資料のHTMLにコメント機能を持たせ、その指摘をそのまま修正プロンプトにしてClaude Codeに渡す、というワークフロー…

    Zenn

  24. 2026年6月8日

    SafeGene: 転送可能な安全性アライメントのための再利用可能なアダプター

    オープンウェイトLLMは、カスタマイズされたアシスタントへのファインチューニングが増加していますが、下流のファインチューニングにより安全性アライメントが弱まり、訓練データが意図的に有害でない場合でも、モデルが悪質なプロンプトに対して脆弱になる可能性があります。ターゲットモデルが新しいタスクデータやユーザーインタラクションで繰り返し更新されるため、反復的な安全性回復の問題が生じます。本論文では、各アーキテクチャ互換モデルファミリー内での横断的再利用のために設計された再利用可能な安全性アダプターモジュール「SafeGene」を提案します。安全性回復をモデル固有の修復ステップとして扱う代わりに、SafeGeneは安全性能力をタスク固有の更新から分離された独立した再利用可能なアダプター表現として扱います。この表現は、アラインされた-劣化したモデルの差分から取得され、データに対応したレイヤー選択を通じてタスク転送可能な安全性ベクトルに精密化され、各下流タスク適応モデルで少数ショットレイヤー単位の係数再キャリブレーションを通じて表現されます。

    arXiv cs.AI

  25. 2026年6月8日

    LLM個人化における人間中心への再配置

    大規模言語モデル(LLM)の個人化能力に関する評価のほとんどが合成データに依存している中、実際のユーザーに対する現在の個人化システムの有効性は不明である。本論文では、合成データと人間データを使用した場合のLLM個人化性能のギャップを調査する。550の人間会話と個人化の3段階にわたる判断を収集した:会話からのユーザー属性抽出(5,949の判断)、新しいプロンプトへの関連属性のペアリング(11,919)、個人化応答への関連属性の組み込み(1,101)。人間データの組み込みにより各段階でシステムの制限が明らかになった。モデルは人間会話から属性抽出に苦労し、関連属性に関する人間の判断と一致せず、個人化応答を生成する際は人間が汎用応答と同等以下と判定している(LLMは広くより良いと評価しているが)。最初の2段階で自動化個人化評価を人間データに近づけるための2つの軽量トレーニングベースの介入を導入する。しかし第3段階では、学習された報酬モデルが人間の評価とのみわずかな相関を達成するに過ぎず、人間に合わせた個人化品質判定を直接モデル化することが困難であることを示唆している。

    arXiv cs.CL

  26. 2026年6月9日

    マイク不要でAmazon Nova Sonicの音声エージェントを大規模に評価する

    このポストでは、システムプロンプトとツール設定の調整を高速に反復できるツール(会話を実行し、結果を確認し、調整を繰り返す)として機能し、音声エージェントの品質を大規模に検証する包括的な評価フレームワークとして設計された、オープンソースフレームワークであるNova Sonic Test Harnessについて説明します。

    AWS Machine Learning Blog

  27. 2026年6月9日

    アップルが新しいショートカットアプリでAIを使用したワークフロー構築を実現

    Shortcutsがアップグレードされ、プロンプトで目的のワークフローを説明するだけでAIが構築できるようになる。

    TechCrunch

  28. 2026年6月9日

    AIコンテ制作サービス「Craftin 1.0」提供開始、カットの説明を入力するとAIが画像生成用にプロンプトへ変換

    Craftin株式会社は6月2日に、絵コンテのキャプション(「字コンテ」)を入力することで、その内容をAI用のプロンプトへ変換してコンテ画像を生成するサービス「Craftin 1.0」のリリースを発表した。

    ASCII.jp

  29. 2026年6月9日

    AIで「平凡な答え」しか出ない人へ…ノーベル賞級の思考法を入手する、禁断プロンプト

    近年AIが進化し、今やAIに聞けば、膨大な公開情報をもとに企画のたたき台をすぐに作れます。しかし、その成果物を見て「間違ってはいないが、強くない」「どこか既視感がある」と感じることはないでしょうか。誰でもアクセスできる情報だけで考えた結論は、誰でもたどり着けるものになりがちです。

    はてなブックマーク IT

  30. 2026年6月10日

    ワンオフのプロンプトからワークフローへ:GitHub Copilot CLIでカスタムエージェントを使用する方法

    カスタムエージェントにより、GitHub Copilot CLIはスタックとチームのワークフローを理解し、ワンオフのターミナルプロンプトを反復可能でレビュー可能なプロセスに変換します。

    GitHub Blog (AI)