åºäºæ ç¾ç AI 代çè®°å¿æ£ç´¢ | AIçæåç¿»è¯
é®é¢ï¼èèå°å è½½è¿å¤æ å ³ç context ä¼éä½ LLM çååºè´¨éï¼ä½¿ç¨åºäº tag çæ£ç´¢ç³»ç»ï¼LLM + database searchï¼æ¥ä½ä¸º AI agent memory çæ¹æ³æ¯å¦æ£ç¡®ï¼
åçï¼
ä½ å®å ¨æ£ç¡® ââ è¿è¢«ç§°ä¸º RAG + Tag-Based Memory
ä½ è¯å«åºçæ ¸å¿é®é¢
âlost in the middleâ ç 究论æ (Liu et al., 2023) è¯å®äºè¿ä¸ç¹ ââ LLM å¨å¤çä½äºé¿ context ä¸é´ä½ç½®çä¿¡æ¯æ¶è¡¨ç°æå·®ã大èçè¿ä½æ¹å¼åç¸åï¼å®ä¼ä¸»å¨æå¶æ å ³ä¿¡æ¯å¹¶æåç¸å ³ä¿¡æ¯ã
ä½ ç Tag-Based è§£å³æ¹æ¡ ââ æ£ç¡®çæ¶æ
User Prompt
â
[LLM] çæ tags + topicsï¼ä¾å¦ï¼"python, async, bug-fix, 2024-march"ï¼
â
[Vector DB / Tag Index] éè¿ tags æç´¢ä¹åç 10k 个 sessions
â
è¿å Top-K ç¸å
³ sessionsï¼ä¾å¦ï¼ä»
éå 5-10 个ï¼
â
[LLM] ä»
使ç¨è¿äºæ£ç´¢å°çç¸å
³ chunks è¿è¡åç
è¿æ¬è´¨ä¸æ¯å¨ RAG (Retrieval-Augmented Generation) ä¹ä¸å å äº tag-assisted retrievalã
为ä»ä¹ Tags æ¯çº¯ Vector Search æ´æå¸®å©
- Vector search 寻æ¾è¯ä¹ç¸ä¼¼çææ¬ ââ è½ç¶ä¸éï¼ä½å¯è½ä¼éè¿ç²¾ç¡®çè¯é¢å¹é
- Tags æ¯æ¾æ§çãåç±»åçï¼ä¸ç´¢å¼åæç´¢é度æå¿«
- ç»åæ¹æ¡ = tags 缩å°åéæ± â vector search è¿è¡éæåº (re-rank) â åªææç¸å ³ç chunks è¿å ¥ context
è¿ä¿è¯äº context ä½ç§¯å°ãç¸å ³æ§å¼ºä¸è´¨éé«ã
ç°å®ç³»ç»çåæ³ï¼ä½ æ³æ³çç产ç¯å¢è½å°ï¼
ææä¸¥èç memory ç³»ç»é½éµå¾ªä½ çé»è¾ï¼ç»ä¸å è½½ææå 容ï¼å§ç»æéæ©æ§å°è¿è¡ retrieveã
ä½ ææå°çå ³é®è§è§£
大è = èæ³å¼ãå¹¶è¡çã䏻卿å¶åªå£° LLM = é¡ºåº token å¤çãéåªå£°å¢å èéå
å æ¤ï¼æ¶æå¿ é¡»å¨å¤é¨æ¨¡ä»¿å¤§èçè¡ä¸ºï¼
å卿æå
容 â ä½¿ç¨ tags/vectors 建ç«ç´¢å¼
æéæ©æ§å°æ£ç´¢ â ä»
å è½½ç¸å
³å
容
ä¿æ context ç²¾ç® â ç¡®ä¿ LLM ä¿ææé
å®é ç Tag çç¥
为æ¯ä¸ª session èªå¨çæï¼
- Topic tags:
python,docker,finance - Action tags:
debug,design,explain - Time tags:
2025-Q1,recent - Entity tags:
project-X,user-goal-Y
ç¶åå¨ query æ¶ï¼å¹é tags â æ£ç´¢å 5-10 个 chunks â æ³¨å ¥ contextã
è¿å®å ¨æ¯æ£ç¡®çæ¹æ³ï¼ä¹æ¯ç®åé¿æ LLM agent memory çæä½³å®è·µã
