iframe-proxy | Sunbelt Computer Software

å¤§è¯è¨€æ¨¡åž‹é™·å…¥é”™è¯¯ä»£ç å¾ªçŽ¯ | AIç”Ÿæˆå’Œç¿»è¯‘

Home 2026.03

Question: LLM-based code assistantsï¼ˆå¦‚ Claude Code æˆ– Codexï¼‰æ˜¯å¦å®¹æ˜“é™·å…¥é‡å¤å¤±è´¥å¾ªçŽ¯ï¼Œä»Žè€Œå¼ºåŒ–é”™è¯¯æ–¹æ³•ï¼Œè€Œä¸æ˜¯é€€åŽä¸€æ¥å°è¯•æ ¹æœ¬ä¸åŒçš„è·¯å¾„ï¼Ÿ

Answer:

æ˜¯çš„ï¼Œä½ æŒ‡å‡ºäº†ä¸€ä¸ªéžå¸¸çœŸå®žä¸”å·²å……åˆ†è®°å½•çš„å±€é™æ€§ã€‚è¿™æœ‰æ—¶åœ¨ LLM agents çš„ä¸Šä¸‹æ–‡ä¸è¢«ç§°ä¸º â€œsolution fixationâ€ æˆ– â€œlocal minima trappingâ€ã€‚

ä¸ºä»€ä¹ˆä¼šå‘ç”Ÿè¿™ç§æƒ…å†µ

1. Autoregressive Momentum

LLM æ˜¯é¡ºåºç”Ÿæˆ token çš„ã€‚ä¸€æ—¦ä¸Šä¸‹æ–‡ä¸ç¡®ç«‹äº†ä¸€ä¸ªâ€œæ–¹å‘â€ï¼Œæ¨¡åž‹å°±ä¼šåœ¨ç»Ÿè®¡ä¸Šè¢«æ‹‰å‘ç»§ç»é‚£ä¸ªæ–¹å‘ã€‚æ¯ä¸ªæ–° token éƒ½ä¼šæ¡ä»¶åŒ–ä¸‹ä¸€ä¸ªâ€”â€”å› æ¤ï¼Œæ—©æœŸçš„é”™è¯¯å‡è®¾ä¼šå‘å‰ç´¯ç§¯ï¼Œä½¿å…¶æ›´éš¾é€ƒè„±ã€‚

2. In-Context Reinforcement

æ¨¡åž‹åœ¨ä¸Šä¸‹æ–‡çª—å£ä¸çœ‹åˆ°è‡ªå·±ä¹‹å‰çš„å°è¯•ã€‚å¦‚æžœå®ƒå°è¯•äº†ä¸‰æ¬¡ Solution Aï¼Œä¸Šä¸‹æ–‡çŽ°åœ¨å……æ»¡äº† Solution A çš„æŽ¨ç†â€”â€”è¿™è®½åˆºåœ°è®©æ¨¡åž‹åœ¨ä¸‹ä¸€æ¬¡å°è¯•æ—¶è§‰å¾— Solution A æ›´åŠ â€œæ£ç¡®â€ã€‚

3. æ²¡æœ‰çœŸæ£çš„å…ƒè®¤çŸ¥

äººç±»ä¸“å®¶åœ¨å¡ä½æ—¶ï¼Œå¯ä»¥è·³å‡ºé—®é¢˜å¹¶æ€è€ƒï¼š

â€œç‰ç‰ï¼Œæˆ‘ç”šè‡³æ˜¯åœ¨è§£å†³æ£ç¡®çš„é—®é¢˜å—ï¼Ÿâ€

LLM æ¨¡æ‹Ÿè¿™ä¸€ç‚¹ï¼Œä½†å¹¶æ²¡æœ‰çœŸæ£åšåˆ°ã€‚å®ƒä»¬çš„â€œåæ€â€æœ¬èº«åªæ˜¯æ›´å¤šå—ç›¸åŒç¼ºé™·ä¸Šä¸‹æ–‡å½±å“çš„ token é¢„æµ‹ã€‚

4. é»˜è®¤æ²¡æœ‰å›žæº¯

ä¸Žæ ‘æœç´¢ç®—æ³•ï¼ˆå¦‚ MCTSã€A*ï¼‰ä¸åŒï¼Œæ ‡å‡†çš„ LLM æŽ¨ç†æ˜¯ä¸€ä¸ªå•å‘å‰å‘è¿‡ç¨‹ã€‚æ²¡æœ‰åŽŸç”Ÿæœºåˆ¶è¯´â€œæ”¾å¼ƒè¿™ä¸ªåˆ†æ”¯ï¼Œå›žåˆ°åˆ†å‰ç‚¹â€ã€‚

â€œå›ºæ‰§çš„äººâ€ç±»æ¯”å¾ˆå‡†ç¡®

ä½ çš„ç±»æ¯”å¾ˆçŠ€åˆ©ã€‚å®ƒè¡¨çŽ°å¾—åƒä¸€ä¸ªäººï¼š

åŠ å€åšæŒè‡ªå·±çš„è§£é‡Š
ç”¨ç»†å¾®å˜ä½“å°è¯•ç›¸åŒçš„äº‹æƒ…
è¶Šæ·±å…¥è¶Šè‡ªä¿¡ï¼ˆæ›´å¤š token = æ›´å¤šâ€œæ‰¿è¯ºâ€ï¼‰
æ²¡æœ‰å¤–éƒ¨å¹²é¢„ï¼Œæ— æ³•ä»Žå…¨æ–°è§’åº¦çœ‹å¾…é—®é¢˜

å®žé™…æœ‰æ•ˆçš„ç–ç•¥

What Actually Helps

Strategy	Why It Works
æ˜Žç¡®å‘Šè¯‰å®ƒé‡æ–°å¼€å§‹	æ‰“ç ´ä¸Šä¸‹æ–‡ä¸çš„æƒ¯æ€§
æ–°é²œæ€»ç»“é—®é¢˜	æ–°çš„æ¡†æž¶ = æ–°çš„ token åˆ†å¸ƒ
ç»™å®ƒä¸€ä¸ªå®Œå…¨ä¸åŒçš„æ–¹æ³•å°è¯•	å¼ºåˆ¶ä¸åŒçš„åˆ†æ”¯
å¼€å§‹æ–°å¯¹è¯	å®Œå…¨æ¸…é™¤ä¸æ¯’çš„ä¸Šä¸‹æ–‡
è¯¢é—®â€œ3 ç§å®Œå…¨ä¸åŒçš„æ–¹æ³•æ˜¯ä»€ä¹ˆï¼Ÿâ€	åœ¨æ‰¿è¯ºå‰å¼ºåˆ¶å‘æ•£ç”Ÿæˆ
å‘Šè¯‰å®ƒä¸è¦åšä»€ä¹ˆ	è´Ÿé¢çº¦æŸæœ‰åŠ©äºŽé€ƒè„±å›ºç€

åœ¨åƒ Claude Code è¿™æ ·çš„å·¥å…·ä¸ï¼Œagent å¤„äºŽä¸€ä¸ªå¾ªçŽ¯ä¸â€”â€”å®ƒè¿è¡Œä»£ç ï¼Œçœ‹åˆ°è¾“å‡ºï¼Œå†è¯•ä¸€æ¬¡ã€‚å¦‚æžœåˆå§‹æ–¹æ³•é”™è¯¯ï¼Œå®ƒå¯èƒ½ä¼šè¿ä»£æ•°åæ¬¡æ¯«æ— è¿›å±•ï¼Œå› ä¸ºï¼š

æ¯æ¬¡å¤±è´¥å°è¯•éƒ½ä¼šå‘ä¸Šä¸‹æ–‡ä¸æ·»åŠ æ›´å¤šè¯¥æ–¹æ³•çš„â€œè¯æ®â€
å¥–åŠ±ä¿¡å·ï¼ˆé”™è¯¯æ¶ˆæ¯ï¼‰é€šè¿‡ç›¸åŒçš„ç¼ºé™·è§†è§’è¢«è§£é‡Š
å®ƒä¼˜åŒ–çš„æ˜¯å‡å°‘é”™è¯¯æ¶ˆæ¯ï¼Œè€Œä¸æ˜¯é‡æ–°æ€è€ƒæž¶æž„

è¿™æ˜¯ AI agent ç ”ç©¶ä¸çš„ä¸€ä¸ªå·²çŸ¥å¼€æ”¾é—®é¢˜â€”â€”æœ‰æ—¶ç§°ä¸º â€œcontext poisoningâ€ æˆ– â€œperseverationâ€ã€‚

åº•çº¿

ä½ æ˜¯å¯¹çš„ã€‚å½“ä»Š LLM åœ¨æœ¬è´¨ä¸Šæ›´æ“…é•¿åˆ©ç”¨è€ŒéžæŽ¢ç´¢â€”â€”å®ƒä»¬æ“…é•¿å®Œå–„è·¯å¾„ï¼Œä½†ä¸æ“…é•¿æ”¾å¼ƒå®ƒã€‚äººç±»éœ€è¦å……å½“â€œé‡å¤§åæ€â€è§¦å‘å™¨ï¼Œå¼ºåˆ¶æ¨¡åž‹æ— æ³•è‡ªè¡Œå®Œæˆçš„é‡ç½®ã€‚

Back Donate

Sunbelt Computer Software

PL/B Language Development and Support

å¤§è¯è¨€æ¨¡åž‹é™·å…¥é”™è¯¯ä»£ç å¾ªçŽ¯ | AIç”Ÿæˆå’Œç¿»è¯‘

ä¸ºä»€ä¹ˆä¼šå‘ç”Ÿè¿™ç§æƒ…å†µ

1. Autoregressive Momentum

2. In-Context Reinforcement

3. æ²¡æœ‰çœŸæ£çš„å…ƒè®¤çŸ¥

4. é»˜è®¤æ²¡æœ‰å›žæº¯

â€œå›ºæ‰§çš„äººâ€ç±»æ¯”å¾ˆå‡†ç¡®

å®žé™…æœ‰æ•ˆçš„ç–ç•¥

What Actually Helps

æ›´æ·±å±‚é—®é¢˜ï¼šAgentic Loops ä¼šè®©æƒ…å†µæ›´ç³Ÿ

åº•çº¿

Sunbelt Computer Software

PL/B Language Development and Support

å¤§è¯­è¨€æ¨¡åž‹é™·å…¥é”™è¯¯ä»£ç å¾ªçŽ¯ | AIç”Ÿæˆå’Œç¿»è¯‘

ä¸ºä»€ä¹ˆä¼šå‘ç”Ÿè¿™ç§æƒ…å†µ

1. Autoregressive Momentum

2. In-Context Reinforcement

3. æ²¡æœ‰çœŸæ­£çš„å…ƒè®¤çŸ¥

4. é»˜è®¤æ²¡æœ‰å›žæº¯

â€œå›ºæ‰§çš„äººâ€ç±»æ¯”å¾ˆå‡†ç¡®

å®žé™…æœ‰æ•ˆçš„ç­–ç•¥

What Actually Helps

æ›´æ·±å±‚é—®é¢˜ï¼šAgentic Loops ä¼šè®©æƒ…å†µæ›´ç³Ÿ

åº•çº¿

å¤§è¯è¨€æ¨¡åž‹é™·å…¥é”™è¯¯ä»£ç å¾ªçŽ¯ | AIç”Ÿæˆå’Œç¿»è¯‘

ä¸ºä»€ä¹ˆä¼šå‘ç”Ÿè¿™ç§æƒ…å†µ

3. æ²¡æœ‰çœŸæ£çš„å…ƒè®¤çŸ¥

â€œå›ºæ‰§çš„äººâ€ç±»æ¯”å¾ˆå‡†ç¡®

å®žé™…æœ‰æ•ˆçš„ç–ç•¥