FlowTune Media

OpenClawが午前3時に"夢を見て"記憶を整理するようになった — v2026.4.5が追加した3段階メモリと動画生成

AIエージェントに「睡眠」を実装した人が現れた。

2026年4月5日、GitHub 35万スターのオープンソースAIアシスタントOpenClawが、バージョンv2026.4.5をリリースした。目玉は3つ。動画と音楽の直接生成"Dreaming"と名付けられた記憶整理システム、そして12言語に拡張されたUI

変則的なリリースノートの読み方をする人間として正直な感想を先に書くと、Dreamingの設計が一番面白い。動画生成機能の追加はKuberneteの拡張パターンから容易に予想できたが、記憶を3段階の睡眠フェーズで昇格させていく発想は、少なくともOSSエージェントの文脈では前例がない。

OpenClawそのものの来歴や、Anthropicとの公的な衝突、セキュリティ上のリスクについては既存記事「OpenClawは本当に安全か?」で詳しく扱った。今回の記事ではv2026.4.5のアップデート内容に絞って読み解く。

Dreamingは何を解決しているのか

OpenClawのような長く使うAIエージェントは、長く使えば使うほどメモリが散らかるという共通の悩みを抱えている。ユーザーが雑談で振ったその場限りの情報、1回しか出てこないファイル名、プロジェクト途中のTODO、無駄話の中に埋もれた重要な決定——これらを単純に全部覚えておくとエージェントの応答は重くなり、ノイズに押されて肝心な情報が引き出せなくなる。

一般的なエージェントはこれに対して「全部捨てる(短期メモリのみ)」か「全部残す(RAGで検索)」の二択で凌いできた。Dreamingが提案しているのは第3の道で、**「短期メモリから本当に意味のある信号だけを選び、長期メモリに昇格させる」**という2層構造だ。

人間の睡眠が記憶の定着に関わっているらしい——という神経科学の言い伝えから名前を取ってきているのは少しロマンチックすぎる気もするが、アーキテクチャとしては筋が通っている。

3段階のフェーズを分解する

Dreamingは/dreamingコマンドで起動し、デフォルトでは毎日午前3時にcron経由で自動発火する。処理は3つのフェーズを順に通過する。

Light Sleep(浅い睡眠): 取り込みと整理

直近の短期メモリ、ユーザーとの対話ログ、日次のメモリファイルから生のシグナルを拾ってくる。重複を取り除き、プライバシー的にまずい部分(redacted transcripts)をマスクしたうえで、候補の行リストをステージングする。要は「材料を並べる」フェーズ。

REM Sleep(レム睡眠): パターンの抽出

直近のトレースからテーマ振り返りのサマリーを作る。ここでは個別の事実ではなく、「このユーザーは最近Rustのエラーハンドリングにずっと悩んでいる」のような上位のパターンを抽出する。レム睡眠と名付けているのは、人間のREM睡眠で夢を通じたパターン統合が起きると言われているからだろう。

Deep Sleep(深い睡眠): 昇格の判定

最終フェーズ。候補の各メモリに対して6つの重み付きシグナルでスコアを計算する。

シグナル 重み 何を測るか
Relevance 0.30 直近の会話文脈との関連度
Frequency 0.24 どれだけ繰り返し呼び出されたか
Query diversity 0.15 多様な文脈で呼び出されたか
Recency 0.15 最近どれだけ参照されたか
Consolidation 0.10 既存の長期記憶との整合
Conceptual richness 0.06 概念的な厚み

計算されたスコアが3つのゲートをすべて通過したものだけが、MEMORY.md(長期記憶ファイル)に昇格する。

  • minScore 0.8 以上
  • minRecallCount 3 以上(少なくとも3回は呼び出されていること)
  • minUniqueQueries 3 以上(3つ以上の異なる問い合わせ文脈で登場していること)

この閾値の厳しさが、個人的にDreamingの本気度を象徴していると思う。「関連度0.8」「3回以上の呼び出し」「3つの別文脈」という3段階フィルタを全部通るメモリは、ノイズの可能性がかなり低い。1日1回の実行サイクルなので昇格は緩やかに進むが、それで十分だろう。

Dream Journalが面白い

Dreamingの実行結果はDream Journalという人間向けのパネルに出力される。どのメモリが昇格して、どれが却下されたか、スコアの内訳付きで可視化される。

これ、地味だが重要だ。エージェントが自分の記憶を編集しているのをユーザーが監査できるという発想は、OpenClawの透明性ポリシーを反映している。たとえば「なぜか最近このエージェントが特定の話題に引っ張られる」と感じたとき、Dream Journalを遡ればどの記憶が昇格したかが全部見える。長期記憶のブラックボックス化を防ぐための設計として評価していい。

動画生成バンドルの実装戦略

もう1つの目玉は、エージェントが自分から動画と音楽を生成できるようになったこと。これまでOpenClawでメディアを作ろうとすると、外部MCPサーバーや自前のスクリプトを通す必要があった。v2026.4.5からは公式のビルトイン機能として10を超えるプロバイダが同梱される。

動画側のデフォルト3種は明示的にチューニングされている。

  • xAI(grok-imagine-video): 5秒クリップで30秒以下の生成速度。速度重視の場面に。
  • Runway: Gen-4系で品質は業界トップ格。仕上げ用。
  • Alibaba Wan: 最低12GB VRAMのローカルGPUで回せるため、クラウド課金ゼロで動かしたい人向け。

さらにComfy、Google、MiniMax、OpenAI、Qwen、Together AI、BytePlus、falがプロバイダとして選べる。音楽生成はComfy、Google、MiniMaxの3種がいまのところ対応。

この「複数プロバイダを同一API面で抽象化する」アプローチは、Claude APIのadvisor toolAnthropicの多角化戦略と通じるものがある。特定のベンダーに縛られないことで、値上げ・品質低下・BANリスクを分散できる。

個人的に面白いと思うのは、xAIのgrok-imagine-videoが標準バンドルに入っていること。xAI自体はAnthropicやOpenAIとは別の立ち位置で、商用利用条件も比較的緩い。OpenClawがAnthropicとの契約問題で揉めた過去を考えると、意図的にxAIをデフォルトに据えた可能性は高い。ベンダーポートフォリオの選択がポリティカルなメッセージになっている、とも読める。

何が実現できるか

この機能追加の組み合わせで、これまでOpenClawが担えなかった作業が現実的に射程に入ってくる。

1つめ。長期プロジェクトの相棒としての安定性向上。 数ヶ月単位で同じコードベースに向き合う開発者にとって、「先月の判断を覚えているアシスタント」は貴重だ。Dreamingによって、何度も参照した判断基準や繰り返し登場したAPIの癖が、自動的に長期記憶として定着していく。短期ノイズに埋もれにくいので、長期記憶の品質が時間とともに上がる可能性がある。

2つめ。素材制作を含むエンドツーエンドのワークフロー。 たとえば「このプロジェクトのデモ動画を作って、適当なBGMも付けて、READMEの冒頭に埋め込んで」という指示が、1つのエージェント内で完結する。従来なら動画生成サービスにログインし、BGMを別サービスで生成し、ダウンロードして配置という手数が必要だった。v2026.4.5はこの導線を短縮する。

3つめ。多言語チームへの展開。 12言語対応のUIは地味だが、日本語・簡体字・繁体字が揃っている点は日本のチームにとって大きい。以前はOpenClawを導入するときに「英語UIに耐えられる人だけ」という暗黙の条件があったが、その壁が崩れた。

正直気になるところ

v2026.4.5は盛りだくさんだが、使う前に知っておきたい懸念もいくつかある。

Dreamingはexperimentalと明記されていて、デフォルトではオフだ。有効化するにはメモリコアの設定でopt-inする必要がある。実験機能を本番の個人データで動かすのは、それなりにリスクがある判断だと思っておいた方がいい。万一Dreamingが誤った重み付けで誤情報を長期記憶に昇格させたら、削除するまで気づかない可能性がある。

動画生成バンドルは便利だが、プロバイダごとの利用料金とレートリミットはユーザー負担だ。OpenClaw自体は無料OSSだが、裏で呼び出すxAIやRunwayは課金される。うっかり100本生成するとクレジットが飛ぶ。これまでメディア生成をしてこなかったユーザーほど、最初に請求書を見て驚く構図になる気がする。

そしてセキュリティ面。既存記事で扱ったように、OpenClawは50以上のメッセージングプラットフォームに接続する設計上、攻撃面が広い。v2026.4.5はセキュリティハードニングを謳っているが、新機能が追加されるたびに新しい脆弱性の可能性も生まれる。個人の開発環境で遊ぶには素晴らしいが、企業で本格導入する前には独自のセキュリティレビューを挟むのが賢明だろう。

総評

v2026.4.5はOpenClawにとって**「ローカルAIスタックの総合商社」化を明確に打ち出したリリースだと読める。これまでは「Claude/GPTを便利に呼ぶラッパー」の色が濃かったが、動画・音楽・メモリ・UIまで自前で抱え込みに来た。Anthropicとの関係がこじれた2026年のOSSエージェント界隈で、OpenClawは独自路線を強めることで生存戦略にしている**という見立てが成立する。

Dreamingは評価が分かれる機能になりそうだ。うまくハマれば「ずっと使うほど賢くなるエージェント」という新しい体験をもたらす。うまくハマらなければ、謎のゴミが長期記憶に昇格してエージェントの応答が迷子になる。個人的には試す価値は十分あると思うが、本番投入は数バージョン様子を見てからでいい。

リリースノートの全量はGitHub releasesで確認できる。Dreamingの設計詳細は公式ドキュメントのDreamingページにまとまっている。ClawHubの44,000+スキルも併せて覗いておくと、このエコシステムがどこまで膨張しているかの温度感が掴める。

関連記事