Antigravityを活用したマルチモーダルRAGの実装と検証

OVERVIEW

Antigravityを用い、ウェブ上の非構造データをキャプチャして構造化し、RAG(検索拡張生成)のソースとして活用する自動化パイプラインを構築。

YEAR 2026

【使用ツール/スタック】

  • Orchestration: Antigravity
    ローコードツールを基盤とすることで、複雑なAPI連携のプロトタイピング速度を最大化

  • Analysis: NotebookLM (検証中)
  • Database: Notion API (実装予定)

  • Format: PDF / HTML / Image

【現在のフェーズ:データ変換プロセスの最適化】

現在は、Antigravityを介した「Webコンテンツ→HTML/PDF変換」における情報の再現性維持が最大の技術課題となっている。

  • 直面している課題: HTML変換時のレイアウト崩れによるコンテキストの欠落。

  • 現在の試行: 従来のDOM解析(HTML)による情報抽出の限界を突破するため、マルチモーダルLLM(Vision API)を用いた視覚的構造解析へのシフトを検証中。 

 【最終目的】 

インプットの自動化により、分析フェーズ(NotebookLM)への迅速な移行と、最終的なNotionでのナレッジ共有の完全自動化を目指す。

 


15年のCG制作で培った『画像構造への深い理解』を、マルチモーダルAIによる視覚的情報抽出(Vision-based RAG)に最適化させるアプローチを研究しています。