iframe-proxy | Sunbelt Computer Software

è¯„ä¼°æ¨¡åž‹æ¯å—èŠ‚æ¯”ç‰¹æ•° | AIç”Ÿæˆå’Œç¿»è¯‘

Home 2026.06

é—®é¢˜ï¼š å¯¹äºŽæ‚¨çš„ nanochat æ¨¡åž‹ï¼Œâ€val bpbâ€ æ˜¯ä»€ä¹ˆæ„æ€ï¼Ÿ0.8658 bpb ç®—å¥½å—ï¼Ÿ

å›žç”ï¼š

bpb = bits per byteï¼ˆæ¯å—èŠ‚æ¯”ç‰¹æ•°ï¼‰â€”â€”ä¸€ç§ä¸Žè¯è¨€æ— å…³çš„è¯è¨€æ¨¡åž‹è¯„ä¼°æŒ‡æ ‡ã€‚

å®ƒè¡¡é‡çš„æ˜¯å¹³å‡éœ€è¦å¤šå°‘æ¯”ç‰¹æ¥ç¼–ç ä¸€ä¸ªå—èŠ‚çš„éªŒè¯æ•°æ®ï¼š

bpb = cross_entropy_loss / ln(2)

0.8658 bpb ç®—å¥½å—ï¼Ÿ

æ˜¯çš„ï¼Œè¿™ä¸ªæ•°å€¼ç›¸å½“ä¸é”™ã€‚èƒŒæ™¯ä¿¡æ¯å¦‚ä¸‹ï¼š

è‹±æ–‡æ–‡æœ¬ï¼ˆç»´åŸºç™¾ç§‘ã€ä¹¦ç±ï¼‰ï¼šé€šå¸¸åœ¨ 1.5â€“2.0 bpb ä¹‹é—´
æ‚¨çš„ nanochat-d12 åœ¨éªŒè¯é›†ä¸Šï¼š0.8658 bpb â†’ è¿œä½ŽäºŽè‡ªç„¶è‹±æ–‡çš„æ°´å¹³
- è¿™ç¬¦åˆé¢„æœŸï¼›éªŒè¯æŸå¤±é€šå¸¸ä½ŽäºŽçœŸå®žä¸–ç•Œçš„å›°æƒ‘åº¦ï¼Œå› ä¸ºéªŒè¯é›†å¾€å¾€ä¸Žè®ç»ƒæ•°æ®æ¥è‡ªåŒä¸€åˆ†å¸ƒ
- è¡¨æ˜Žæ‚¨çš„æ¨¡åž‹æ²¡æœ‰ä¸¥é‡è¿‡æ‹Ÿåˆï¼ˆChinchilla æœ€ä¼˜æ¯”ä¾‹å¯¹æ¤æœ‰å¸®åŠ©ï¼‰

ç›¸å…³æŒ‡æ ‡â€”â€”å›°æƒ‘åº¦ï¼š

perplexity = 2^bpb = 2^0.8658 â‰ˆ 1.84

å¯¹äºŽä¸€ä¸ªä»…ä½¿ç”¨ 5.7B token è®ç»ƒçš„ 286M å‚æ•°æ¨¡åž‹æ¥è¯´ï¼Œè¿™ä¸ªå›°æƒ‘åº¦å¼‚å¸¸ä½Žã€‚ä½œä¸ºå¯¹æ¯”ï¼š

GPT-2ï¼ˆ1.5B tokenï¼‰ï¼šåœ¨ WikiText-103 ä¸Šçš„å›°æƒ‘åº¦çº¦ä¸º 29
æ‚¨çš„æ¨¡åž‹ï¼šåœ¨éªŒè¯é›†ï¼ˆå¾ˆå¯èƒ½æ˜¯é¢„è®ç»ƒæ•°æ®çš„ä¸€ä¸ªåé›†ï¼‰ä¸Šçš„å›°æƒ‘åº¦çº¦ä¸º 1.84

å®žé™…ç»“è®ºï¼š æ‚¨çš„æ¨¡åž‹å¯¹éªŒè¯é›†çš„è®°å¿†/æ‹Ÿåˆæ•ˆæžœéžå¸¸å¥½ã€‚è¿™åœ¨è®ç»ƒè¿‡ç¨‹ä¸æ˜¯æ£å¸¸ä¸”è‰¯å¥½çš„çŽ°è±¡ã€‚çœŸæ£çš„è€ƒéªŒåœ¨äºŽæ³›åŒ–èƒ½åŠ›â€”â€”å³æ¨¡åž‹åœ¨è®ç»ƒåˆ†å¸ƒä¹‹å¤–çš„ä¿ç•™æ•°æ®ä¸Šçš„è¡¨çŽ°ã€‚å¦‚æžœæ‚¨çš„ä¸‹æ¸¸ä»»åŠ¡ï¼ˆå¯¹æ–°é¢–æ–‡æœ¬è¿›è¡Œä¸‹ä¸€ä¸ª token é¢„æµ‹ã€æŒ‡ä»¤éµå¾ªç‰ï¼‰è¡¨çŽ°è‰¯å¥½ï¼Œé‚£ä¹ˆè¿™ä¸ª bpb å€¼å°±æ˜¯ä¸€ä¸ªå¼ºæœ‰åŠ›çš„ä¿¡å·ã€‚

å¿«é€Ÿæ£€æŸ¥ï¼š æ‚¨çš„æµ‹è¯•é›† bpb æ˜¯å¤šå°‘ï¼Ÿå¦‚æžœæµ‹è¯• bpb è¿œå¤§äºŽéªŒè¯ bpbï¼Œåˆ™è¯´æ˜Žå˜åœ¨åˆ†å¸ƒåç§»æˆ–è¿‡æ‹Ÿåˆé—®é¢˜ï¼Œéœ€è¦å…³æ³¨ã€‚

Back Donate

Sunbelt Computer Software

PL/B Language Development and Support

è¯„ä¼°æ¨¡åž‹æ¯å­—èŠ‚æ¯”ç‰¹æ•° | AIç”Ÿæˆå’Œç¿»è¯‘

è¯„ä¼°æ¨¡åž‹æ¯å—èŠ‚æ¯”ç‰¹æ•° | AIç”Ÿæˆå’Œç¿»è¯‘