iframe-proxy | Sunbelt Computer Software

ä»Žé›¶å¼€å§‹ç”¨çº¯Pythonå®žçŽ°GPT | AIç”Ÿæˆå’Œç¿»è¯‘

Home 2026.02

é—®é¢˜ï¼š è¯·è§£é‡Š Andrej Karpathy æä¾›çš„ Python è„šæœ¬ï¼Œè¯¥è„šæœ¬ä»Žé›¶å¼€å§‹å®žçŽ° GPT æ¨¡åž‹ï¼Œä¸”ä¸ä¾èµ–ä»»ä½•å¤–éƒ¨åº“ã€‚

å›žç”ï¼š è¿™ä¸ªè„šæœ¬æ˜¯ä¸€éƒ¨â€œæ•™å¦æ°ä½œâ€ï¼Œå°†å¤§åž‹è¯è¨€æ¨¡åž‹ï¼ˆLLMï¼‰å‰¥ç¦»åˆ°æœ€æ ¸å¿ƒçš„ç»„ä»¶ã€‚å®ƒä»…ä½¿ç”¨ Python æ ‡å‡†åº“å®žçŽ°äº†ç”Ÿæˆå¼é¢„è®ç»ƒå˜æ¢å™¨ï¼ˆGPTï¼‰ï¼Œæ²¡æœ‰ PyTorchã€NumPy æˆ– TensorFlowã€‚

ä»¥ä¸‹æ˜¯å®žçŽ°è¯¥åŠŸèƒ½çš„æ ¸å¿ƒç»„ä»¶åˆ†è§£ï¼š

1. â€œå¾®åž‹è‡ªåŠ¨å¾®åˆ†â€å¼•æ“Žï¼ˆ`class Value`ï¼‰

ä»»ä½•æ·±åº¦å¦ä¹ æ¨¡åž‹çš„æ ¸å¿ƒéƒ½æ˜¯åå‘ä¼ æ’ã€‚

é€»è¾‘ï¼š ç”±äºŽè„šæœ¬æ²¡æœ‰ä½¿ç”¨ PyTorchï¼Œå®ƒå®šä¹‰äº†ä¸€ä¸ª Value ç±»ï¼Œå˜å‚¨ä¸€ä¸ªæ ‡é‡ï¼ˆå•ä¸ªæ•°å€¼ï¼‰åŠå…¶å¯¼æ•°ï¼ˆgradï¼‰ã€‚
é“¾å¼æ³•åˆ™ï¼š æ¯ä¸ªæ•°å¦è¿ç®—ï¼ˆ+ã€*ã€expã€logï¼‰éƒ½è¢«é‡è½½ï¼Œä»¥æž„å»ºâ€œè®¡ç®—å›¾â€ã€‚å½“è°ƒç”¨ loss.backward() æ—¶ï¼Œä»£ç ä¼šåå‘éåŽ†è¯¥å›¾ï¼Œè®¡ç®—æ¯ä¸ªå‚æ•°å¯¹è¯¯å·®çš„è´¡çŒ®ã€‚

2. GPT æž¶æž„

è¯¥æ¨¡åž‹éµå¾ª GPT-2 è®¾è®¡ï¼Œä½†ç®€åŒ–äº†éƒ¨åˆ†ç»„ä»¶ï¼ˆä¾‹å¦‚ä½¿ç”¨ RMSNorm ä»£æ›¿ LayerNormï¼Œä½¿ç”¨ ReLU ä»£æ›¿ GeLUï¼‰ã€‚

åµŒå…¥å±‚ï¼š ä½¿ç”¨ä¸¤ä¸ªæŸ¥æ‰¾è¡¨ï¼šwteï¼ˆToken åµŒå…¥ï¼‰è¡¨ç¤ºå—ç¬¦å«ä¹‰ï¼Œwpeï¼ˆä½ç½®åµŒå…¥ï¼‰è¡¨ç¤ºå—ç¬¦åœ¨å—ç¬¦ä¸²ä¸çš„ä½ç½®ã€‚
å¤šå¤´æ³¨æ„åŠ›æœºåˆ¶ï¼š æ¨¡åž‹çš„â€œå¤§è„‘â€ï¼Œå…è®¸å½“å‰å—ç¬¦â€œå›žé¡¾â€å‰é¢çš„å—ç¬¦ä»¥ç¡®å®šä¸Šä¸‹æ–‡ã€‚å®ƒä¸ºæ¯ä¸€æ¥è®¡ç®— Query (Q)ã€Key (K) å’Œ Value (V) å‘é‡ã€‚
å‰é¦ˆç¥žç»ç½‘ç»œï¼ˆMLPï¼‰: ä¸€ä¸ªç®€å•çš„ä¸¤å±‚ç¥žç»ç½‘ç»œï¼Œå¤„ç†æ³¨æ„åŠ›å¤´æ”¶é›†çš„ä¿¡æ¯ã€‚

3. è®ç»ƒä¸Žä¼˜åŒ–

è„šæœ¬åœ¨åå—æ•°æ®é›†ï¼ˆnames.txtï¼‰ä¸Šè®ç»ƒæ¨¡åž‹ã€‚

ç›®æ ‡ï¼š æ¨¡åž‹æ‰§è¡Œä¸‹ä¸€ä¸ª Token é¢„æµ‹ã€‚ä¾‹å¦‚ç»™å®šâ€œA-N-D-Râ€ï¼Œå®ƒä¼šå°è¯•é¢„æµ‹â€œEâ€ã€‚
æŸå¤±å‡½æ•°ï¼š ä½¿ç”¨äº¤å‰ç†µæŸå¤±ï¼ˆé€šè¿‡ log å’Œ softmax è®¡ç®—ï¼‰ï¼Œé¢„æµ‹ç»“æžœä¸Žå®žé™…å—ç¬¦ç›¸å·®è¶Šè¿œï¼Œæƒ©ç½šè¶Šä¸¥é‡ã€‚
Adam ä¼˜åŒ–å™¨ï¼š æ‰‹åŠ¨å®žçŽ° Adam ä¼˜åŒ–ç®—æ³•ï¼Œæ›´æ–°æƒé‡ï¼ŒåŒ…æ‹¬åŠ¨é‡å’Œå¦ä¹ çŽ‡è¡°å‡ç‰ç‰¹æ€§ã€‚

4. æŽ¨ç†ï¼ˆâ€œèƒ¡è¨€ä¹±è¯â€ï¼‰

è®ç»ƒå®ŒæˆåŽï¼Œæ¨¡åž‹ç”Ÿæˆæ–°æ–‡æœ¬ã€‚å®ƒä»Žç‰¹æ®Šçš„ BOSï¼ˆåºåˆ—èµ·å§‹ï¼‰ Token å¼€å§‹ï¼Œè¯·æ±‚æ¨¡åž‹ç»™å‡ºä¸‹ä¸€ä¸ªå—ç¬¦çš„æ¦‚çŽ‡åˆ†å¸ƒï¼Œç„¶åŽæ ¹æ®æ¸©åº¦è®¾ç½®ä»Žè¯¥åˆ†å¸ƒä¸â€œé‡‡æ ·â€ï¼Œç”ŸæˆåŽŸå§‹åˆ—è¡¨ä¸ä¸å˜åœ¨çš„åå—ã€‚

æ€»ç»“è¡¨ï¼šç¡¬ä»¶ vs. è½¯ä»¶

ç‰¹æ€§	æœ¬è„šæœ¬å®žçŽ°	è¡Œä¸šæ ‡å‡†ï¼ˆå¦‚ GPT-4ï¼‰
æ•°å¦è¿ç®—	çº¯ Python å¾ªçŽ¯ï¼ˆæ…¢ï¼‰	GPU å†…æ ¸ / CUDAï¼ˆå¿«ï¼‰
æ•°æ®	å•ä¸ªå—ç¬¦	åè¯â€œTokenâ€
è§„æ¨¡	~7,000 ä¸ªå‚æ•°	ä¸‡äº¿çº§å‚æ•°
å†…å˜	Python åˆ—è¡¨	å¼ é‡ï¼ˆé«˜åº¦åŽ‹ç¼©ï¼‰

ä½ æ˜¯å¦å¸Œæœ›æˆ‘è¯¦ç»†è§£é‡Šæ³¨æ„åŠ›æœºåˆ¶åœ¨æœ¬ä»£ç ä¸å¦‚ä½•è®¡ç®—å—ç¬¦ä¹‹é—´çš„å…³ç³»ï¼Ÿ

Back Donate

Sunbelt Computer Software

PL/B Language Development and Support

ä»Žé›¶å¼€å§‹ç”¨çº¯Pythonå®žçŽ°GPT | AIç”Ÿæˆå’Œç¿»è¯‘

1. â€œå¾®åž‹è‡ªåŠ¨å¾®åˆ†â€å¼•æ“Žï¼ˆclass Valueï¼‰