Antigravityを活用したマルチモーダルRAGの実装と検証
OVERVIEW
Antigravityを用い、ウェブ上の非構造データをキャプチャして構造化し、RAG(検索拡張生成)のソースとして活用する自動化パイプラインを構築。
【使用ツール/スタック】
Orchestration: Antigravity
ローコードツールを基盤とすることで、複雑なAPI連携のプロトタイピング速度を最大化- Analysis: NotebookLM (検証中)
Database: Notion API (実装予定)
Format: PDF / HTML / Image
【現在のフェーズ:データ変換プロセスの最適化】
現在は、Antigravityを介した「Webコンテンツ→HTML/PDF変換」における情報の再現性維持が最大の技術課題となっている。
直面している課題: HTML変換時のレイアウト崩れによるコンテキストの欠落。
現在の試行: 従来のDOM解析(HTML)による情報抽出の限界を突破するため、マルチモーダルLLM(Vision API)を用いた視覚的構造解析へのシフトを検証中。
【最終目的】
インプットの自動化により、分析フェーズ(NotebookLM)への迅速な移行と、最終的なNotionでのナレッジ共有の完全自動化を目指す。

15年のCG制作で培った『画像構造への深い理解』を、マルチモーダルAIによる視覚的情報抽出(Vision-based RAG)に最適化させるアプローチを研究しています。
