¿­·¢ÌìÉúÓ®¼ÒÒ»´¥¼´·¢Ê×Ò³

韩国美女被❌裸体视频观看 ×î½ü¸üÐÂ|¸üÐÂÁбí|×Öĸ¼ìË÷|ÏÂÔØÅÅÐÐ|Æ»¹û×¨Çø|·ÖÀർº½

Ä¿½ñλÖãºÊ×Ò³ ¡ú רÌâºÏ¼¯ ¡ú w3u7903ejky2ywls

k8¡¤¿­·¢ÌìÉúÓ®¼Ò¡¤Ò»´¥¼´·¢(ÖйúÇø)¹Ù·½ÍøÕ¾

À©É¢ÓïÑÔÄ£Ð;ű¶ÍÆÀí¼ÓËÙ£¡KV Cache²¢·Ç×ԻعéÄ£ÐÍרÊô

À©É¢ÓïÑÔÄ£Ð;ű¶ÍÆÀí¼ÓËÙ£¡KV Cache²¢·Ç×ԻعéÄ£ÐÍרÊô

EPIC LabÍÅ¶Ó Í¶¸åÁ¿×Óλ | ÃñÖںŠQbitAI

Ê׸öÓÃÓÚ¼ÓËÙÀ©É¢Ê½´óÓïÑÔÄ£ÐÍ£¨diffusion-based Large Language Models, ¼ò³Æ dLLMs£©ÍÆÀíÀú³ÌµÄÃâѵÁ·ÒªÁì¡£

ÉϺ£½»Í¨´óѧEPIC LabÍŶÓÌá³öÁËÒ»ÖÖÎÞÐèѵÁ·¡¢¼´²å¼´ÓõĸßÐ§ÍÆÀí»º´æ»úÖÆ£ºdLLM-Cache¡£

Æä½¹µã˼ÏëÔÚÓÚ£¬ÔÚÒ»¸ö¶à²½È¥ÔëÀú³ÌÖУ¬¸´ÓÃÏàÁÚʱ¼ä²½Éϱä¸ï½ÏСµÄÌØÕ÷£¬½ö¸üÐÂÄÇЩ±ä¸ï½Ï´óµÄÌØÕ÷£¬´Ó¶øÊµÏÖÁËÅÌËãÁ¿µÄ´ó·ù½µµÍ£¬²¢¼á³ÖÁËÔ­ÓеÄÉú³ÉÖÊÁ¿¡£

ͼ1 ²î±ðdLLMsʹÓÃdLLM¨CCacheºÍ²»Ê¹ÓÃdLLM¨CCacheÔÚËٶȺÍÖÊÁ¿ÉϵıÈÕÕ

dLLM-Cache¾ßÓм¸¸öÖØÒªµÄÁÁµã£º

1. ѵÁ·Î޹أ¬¼´²å¼´Óá£dLLM-CacheÍêÈ«ÔÚÍÆÀíÀú³ÌÖÐÊÂÇ飬ÎÞÐèÐÞ¸ÄÄ£ÐͲÎÊý»òÖØÑµÁ·¡£dLLM-Cache¿ÉÒÔÔÚÍêÈ«²»ËðʧģÐÍÊä³öÖÊÁ¿µÄǰÌáÏ£¬´øÀ´×î¸ß9.1±¶µÄÍÆÀíËÙ¶ÈÌáÉý ¡£

2.ͨÓÃÓÚÖ÷Á÷dLLM¼Ü¹¹£¬ÈçLLaDA¡¢DreamÒÔ¼°LLaDA-V¡¢MMaDA¡¢DimpleµÈ¶àģ̬ģÐÍ¡£

3. ÔÚÍÆÀíÀú³ÌÖУ¬Ê×´Îʶ±ð³öÁËprompt²¿·ÖµÄTransformerÖмä²ãÌØÕ÷£¨Key¡¢Value¡¢Attention output¡¢FFN output£©ºã¾ÃÎȶ¨£¬¶øresponse²¿·Ö½öÓÐһС²¿·ÖtokensµÄÌØÕ÷±ä¸ï½Ï´ó£¬Îª»º´æÌØÕ÷²¢ºóÐø¸´ÓÃÌṩÁËÀíÂÛ»ù´¡¡£

4. ¶À´´ÁËÒÔV-verify»úÖÆÎª½¹µãµÄÑ¡Ôñ¸üÐÂÕ½ÂÔ¡£ÒÔValueÏòÁ¿µÄ±ä¸ïΪѡÔñ»ù×¼£¬ÀÖ³Éʶ±ð³öÁËresponse²¿·Ö±ä¸ï½Ï´óµÄÄÇЩtokens£¬Í¨¹ý½ö¸üÐÂÕâÐ©ÌØÕ÷£¬ÞðÆúÁ˸ߴï75%µÄÈßÓàÅÌËã¡£

±¾ÂÛÎÄÅäºÏµÚÒ»×÷ÕßÁõÖªÔ¶ºÍÑîÞÈ´æÊǹþ¶û±õ¹¤Òµ´óѧ2022¼¶±¾¿ÆÉú£¬Ä¿Ç°ÔÚÉϺ£½»Í¨´óѧEPIC Lab½øÐпÆÑÐʵϰ£¬Ê¦´ÓÕÅÁÖ·åÖúÀí½ÌÊÚ£¬Ö÷ÒªÑо¿Æ«ÏòΪ¸ßЧÉî¶Èѧϰ£¬´ËÇ°ÔøÔÚCVPR2025ÉÏÊÕ»ñÂú·ÖÂÛÎÄ¡£

½ÓÏÂÀ´£¬ÎÒÃÇÒ»ÆðÀ´¿´¿´¸ÃÑо¿µÄϸ½Ú¡£

Ñо¿¶¯»ú

»ùÓÚÀ©É¢µÄ´óÓïÑÔÄ£ÐÍÕý³ÉΪÓïÑÔÉú³ÉÁìÓò×îÊܹØ×¢µÄз¶Ê½Ö®Ò»¡£Ëæ×ÅÄ£Ðͼܹ¹µÄÉú³¤¡¢È¥ÔëËã·¨µÄÓÅ»¯ÒÔ¼°Masked DiffusionÔÚÓïÑÔ½¨Ä£ÖÐÖð²½Õ¹ÏÖ³öÓë×ԻعéÄ£ÐͲî±ðµÄ½¨Ä£ÄÜÁ¦£¬ÕâÀàÄ£ÐÍÕýÔÚÖð²½³ÉΪÌôÕ½ GPT µÈÖ÷Á÷Ä£Ð͵ÄÖØÒªÁ¦Á¿¡£

ÒÔLLaDA¡¢DreamΪ´ú±íµÄÀ©É¢ÓïÑÔÄ£ÐÍ£¬»ùÓÚµü´úÈ¥ÔëµÄÉú³ÉÀú³Ì£¬²»ÔÙÒÀÀµÑϸñµÄ×ԻعéÒò¹û½á¹¹£¬ÌìȻ֧³ÖË«Ïò½¨Ä£¡¢È«¾ÖÒÀÀµºÍ·´ÏòÍÆÀíµÈÄÜÁ¦£¬ÒѾ­ÔÚ¡°Äæ×ª×çÖ䡱¡¢ÊýÑ§ÍÆÀíµÈÈÎÎñÉÏÕ¹ÏÖ³öÁìÏÈÐÔÄÜ¡£

È»¶ø£¬ÕâÖÖ·¶Ê½µÄÓÅÊÆÒ²Åãͬמ޴óµÄ¼ÛÇ®¡£ÎªÁËÈ·±£Éú³ÉµÄÖÊÁ¿£¬dLLMsÔÚÍÆÀíÀú³ÌÖÐͨ³£ÐèÒªÖ´Ðг¤´ïÊý°Ù²½µÄÈ¥Ôëµü´ú£¬Ã¿Ò»²½¶¼ÐèÖØÐÂÅÌËãattention¡¢FFNµÈËùÓвãµÄÌØÕ÷£¬ÅÌËãÁ¿Ï൱ÓÚ¶à´ÎÍêÕûǰÏòÁ÷´«¡£ÕâΪdLLMsµÄÍÆÀíЧÂÊ´øÀ´ÁËÑÏÖØµÄÆ¿¾±£¬ÖÆÔ¼ÁËÆäʵ¼Ê°²ÅÅ¡£¸üÖØÒªµÄÊÇ£¬Ö÷Á÷µÄ¼ÓËÙÊÖ¶ÎÈçÓÃÓÚ×ԻعéÄ£Ð͵ÄKV Cache£¬ÓÉÓÚ²»¼æÈÝË«Ïò×¢ÒâÁ¦¼Ü¹¹£¬ÔÚdLLMsÖÐÍêȫʧЧ¡£

Óë¹Å°åµÄ×ԻعéÓïÑÔÄ£ÐͲî±ð£¬dLLMs²»ÔÙÒÀÀµË³ÐòÉú³ÉÏÂÒ»¸ötoken£¬¶øÊǽÓÄÉËæ»úÕÚ±Î(mask) + Öð²½»¹Ô­µÄ·½·¨½¨Ä£tokenÂþÑÜ£¬ÕâÖÖ»úÖÆÊ¹µÃÄ£Ð;߱¸ÌìÈ»µÄË«Ïò½¨Ä£ÄÜÁ¦£¬ÀíÂÛÉÏÄܹ»¸üºÃµØ´¦ÀíÄæÏòÂß¼­¡¢³¤¾àÀëÒÀÀµµÈÈÎÎñ¡£

LLaDA µÈÄ£ÐÍÒѾ­ÔÚ¶à¸ö»ù×¼ÈÎÎñÖÐÓâÔ½Ö÷Á÷ARMs£¬ÓÈÆäÔÚ¡°Äæ×ª×çÖ䡱ÉÏÃ÷ÏÔʤ³ö¡£

È»¶ø£¬ÕâÖÖÀ©É¢Ê½ÍÆÀí´øÀ´Ò»¸öÑÏÖØµÄÌôÕ½£ºÎªÁËÈ·±£Éú³ÉÖÊÁ¿£¬dLLMsͨ³£ÐèÒªÉϰٲ½µÄÈ¥Ôëµü´ú£¬Ã¿Ò»²½¶¼ÐèÈ«Á¿ÅÌËãAttention¡¢FFNµÈÄ£¿é£¬µ¼ÖÂÆäÍÆÀíËÙ¶ÈÏà±ÈARMsÂýÒ»¸öÊýÁ¿¼¶£¬Â䵨±¾Ç®¸ß¡£Í¬Ê±£¬ARMs ͨÓõļÓËÙÒªÁìÈçKV-CacheÒòdLLMsµÄË«Ïò×¢ÒâÁ¦Éè¼Æ¶øÎÞ·¨¼æÈÝ¡£ÕâЩÔì³ÉÁËdLLMsÔÚÍÆÀíʱ¼ÈÂýÓÖȱ·¦¼ÓËÙÊֶεÄÏÖÏó¡£ÕâÕýÊÇ dLLM-CacheËù񻮮½âµÄ½¹µãÎÊÌâ¡£

ÒªÁì¼ò½é

±¾ÎÄ×÷Õß×ÐϸÑо¿ÁËdLLMsÍÆÀíµÄÖмäÌØÕ÷±ä¸ïÀú³Ì£¬·¢Ã÷ÈçÏÂÒªº¦ÏÖÏó£º

ͼ2 dLLMÖÐÁ½¸öÏàÁÚÈ¥Ôë°ì·¨Ö®¼äµÄKey¡¢Value¡¢Attention OutputºÍFFN OutputµÄÓàÏÒÏàËÆ¶È

Prompt tokensµÄÌØÕ÷ÔÚÕû¸öÈ¥ÔëÀú³ÌÖлù±¾¼á³ÖÎȶ¨£¬Ã¿Ò»²½¶¼ÖØÐÂÅÌËãÕâÐ©ÌØÕ÷ÊÇÍêÈ«²»ÐëÒªÇÒÀË·ÑÅÌËã×ÊÔ´µÄ£»

Response tokens´ó¶¼±ä¸ïºÜС£¬½öÉÙ²¿·Ö±ä¸ï¾çÁÒ£¬È«Á¿ÅÌËãËùÓÐresponse tokens±£´æÈßÓà¡£

ÓÉ´Ë£¬ÎÊÌâת»¯ÎªÁËÈçºÎ¸ßЧʶ±ð³öÕâЩ±ä¸ï¾çÁÒµÄresponse tokens¡£

ͼ3 Response tokensµÄK»òV±ä¸ïÓëÆäËûÌØÕ÷±ä¸ïµÄÏà¹ØÐÔ

±¾ÎÄ×÷ÕßÊ×´´ÐÔµÃÌá³öÁËV-verify»úÖÆ¡£ËüµÄÌá³öÔ´ÓÚÁíÒ»ÏîÖØÒªµÄ·¢Ã÷£º×÷ÕßÁ¿»¯ÁËresponse tokensµÄµ×²ãÌØÕ÷£¨Key, ValueÏòÁ¿£©µÄ±ä¸ïÓëÆäÉϲãÅÓ´óÌØÕ÷£¨Attention Output, FFN Output£©µÄ±ä¸ïÖ®¼äµÄ¹ØÏµ£¬½á¹ûÏÔʾËüÃDZ£´æ×ż«Ç¿µÄÕýÏà¹ØÐÔ£¬Æ¤¶ûÑ·Ïà¹ØÏµÊý×î¸ß¿É´ï0.944¡£

ÕâÒâζ×Å£¬Ò»¸ötokenµ×²ãµÄValueÏòÁ¿ÊÇ·ñ±¬·¢±ä¸ï£¬ÊÇÆäÕûÌå״̬ÊÇ·ñ±¬·¢¸Ä±äµÄÒ»¸ö¼«¼ÑµÄ¡¢ÇÒÅÌË㱾Ǯ¼«µÍµÄ¡°Ö¸Ê¾Æ÷¡±¡£

»ùÓÚÒÔÉÏÕâЩҪº¦µÄÊӲ죬±¾ÎÄ×÷ÕßÌá³öÁËdLLM-Cache £¬¾ßÌåµÄ¿ò¼ÜÉè¼ÆÈçÏ£º

ͼ4 dLLM-CacheÒªÁìÕûÌåpipeline

Prompt»º´æ£º³¤¼ä¸ôÖØÓÃ

¹ØÓÚprompt²¿·Ö£¬×÷ÕßÉè¼ÆÁ˳¤¼ä¸ôPrompt»º´æ£¬Ã¿¸ôKp²½£¨ÔÚʵÑéÖÐÒ»°ãÉèÖÃΪ100£©¸üÐÂÒ»´ÎpromptµÄKey¡¢Value¡¢Attention Output¡¢FFN Output£¬ÆäÓà°ì·¨È«²¿¸´ÓÃÏÈǰ½á¹û¡£ÕâÑùÖÆÖ¹Á˶ÔÎȶ¨Îȶ¨µÄÌØÕ÷µÄÖØ¸´ÅÌË㣬´ó·ù¼õÉÙÁËÅÌËãÁ¿

Response»º´æ£º×ÔÊÊÓ¦²¿·Ö¸üÐÂ

¶ÔÉú³ÉÄ¿±êresponseÇøÓò£¬ÓÉÓÚresponse tokensµÄÌØÕ÷²¢²»ÊÇÒ»Ö±¼á³ÖÎȶ¨Îȶ¨µÄ£¬×÷ÕßÉè¼ÆÁ˽϶̼ä¸ôµÄResponse»º´æ£¬Ã¿¸ôKr²½£¨ÔÚʵÑéÖÐÒ»°ãÉèÖÃΪ8×óÓÒ£©È«Á¿¸üÐÂÒ»´ÎresponseµÄKey¡¢Value¡¢Attention Output¡¢FFN Output£¬ÔÚÆäÓàµÄ°ì·¨£¬×÷ÕßÌá³öÁË»ùÓÚV-verifyµÄ×ÔÊÊÓ¦»º´æÕ½ÂÔ

ÔÚÿ¸öÈ¥Ôë°ì·¨£¬Ê×ÏÈÅÌËãËùÓÐresponse tokens×îеÄValueÏòÁ¿¡£È»ºó£¬Í¨¹ýÅÌËãÐÂValueÏòÁ¿Ó뻺´æÖоÉValueÏòÁ¿µÄÓàÏÒÏàËÆ¶È£¬½«ÓàÏÒÏàËÆ¶È×÷Ϊÿ¸öresponse tokensµÄÒ»¸ö¡°±ä¸ï·Ö¡±¡£Ñ¡³ö¡°±ä¸ï·Ö¡±×î¸ß£¨¼´ÏàËÆ¶È×îµÍ£©µÄÉÙÉÙÊýtokens£¨ÀýÈ磬±ä¸ï×î¾çÁÒµÄ25%£©£¬½«ËüÃDZê¼ÇΪ¡°´ý¸üС± ¡£×îºó£¬Ä£ÐÍÖ»¶ÔÕâЩ±»±ê¼ÇµÄ¡°´ý¸üС±tokens£¬½øÐÐÍêÕûµÄÌØÕ÷ÖØÅÌËã¡£¶øÆäÓà75%µÄ¡°Îȶ¨¡±tokens£¬Ôò¼ÌÐø¸ßЧµØ´Ó»º´æÖи´ÓÃÆäÌØÕ÷

ͨ¹ýÕâÖÖ¡°³¤¼ä¸ô¡±Óë¡°×ÔÊÊÓ¦¡±Ïà½áºÏµÄ»º´æÕ½ÂÔ£¬dLLM-CacheÔÚTransformerµÄÿһ²ã¶¼ÊµÏÖÁËÅÌËãÁ¿µÄ¼«ÖÂÓÅ»¯£¬ÇÒÕû¸öÀú³ÌÎÞÐèÈκÎÌØ±ðѵÁ·£¬×öµ½ÁËÕæÕýµÄ¼´²å¼´ÓÃ

3 ʵÑé½á¹û

±¾ÎÄÔÚ LLaDA 8BºÍDream 7BÁ½´ó´ú±íÐԵĿªÔ´dLLMµÄ»ù´¡°æÓëÖ¸Áî΢µ÷°æÉÏ£¬Õë¶ÔÊýѧÓë¿ÆÑ§¡¢Í¨ÓÃÈÎÎñ¡¢´úÂëÉú³ÉÈý´óÁìÓòµÄ8¸öÖ÷Á÷»ù×¼²âÊÔ£¬¶ÔdLLM-CacheµÄÓÐЧÐÔ½øÐÐÁËÑÏ¿ÁµÄ¼ìÑé ¡£ÆÀ¹Àά¶È²»µ«°üÀ¨ÍÆÀíËÙ¶È£¨TPS£©ÅÌËãЧÂÊ£¨FLOPs£©£¬¸ü½¹µãµÄÊÇÄ£ÐÍÐÔÄܵ÷֣¨Score£©£¬ÒÔÈ·±£¼ÓËÙ²»ÊÇÒÔÎþÉüÄ£ÐÍÄÜÁ¦Îª¼ÛÇ®

±¾ÎÄÔÚLLaDA 8BµÄ»ù´¡°æºÍÖ¸Áî΢µ÷°æÉ϶¼°²ÅÅÁËdLLM-Cache£¬ÏÂͼµÄʵÑé½á¹û³ä·ÖչʾÁËÆäÇ¿´óµÄ¼ÓËÙÄÜÁ¦ºÍ׿ԽµÄÉú³ÉÖÊÁ¿¼á³Ö¡£ÔÚÏÕЩËùÓеĻù×¼²âÊÔÖУ¬µÖ´ïÁË5±¶ÒÔÉϵļÓËÙЧ¹û£¬ÇÒÔÚ¾ø´ó²¿·ÖÇé¿öÏ£¬Éú³ÉÖÊÁ¿¶¼Ã»ÓнµµÍ£¬ÉõÖÁÓÐÇá΢µÄÌáÉý¡£ÌرðÊÇÅüÃæ¶ÔLongBenchÈÎÎñʱ£¬promptµÄÎȶ¨ÐÔ´øÀ´Á˸üÏÔÖøµÄ¼ÓËÙЧ¹û£¬ÔÚHotpotQAÉÏʵÏÖÁ˸ߴï9.1±¶µÄÎÞËð¼ÓËÙ

ͼ5 dLLM-CacheÔÚLLaDAÄ£ÐÍÉϵÄЧ¹û

ΪÁ˽øÒ»²½Ö¤Ã÷dLLM-CacheµÄͨÓÃÐԺͳ°ôÐÔ£¬×÷Õß½«ÆäÎÞ·ìÇ¨ÒÆÖÁÁíÒ»¿î¼Ü¹¹ÂÔÓвî±ðµÄdLLM¡ª¡ªDream 7BÉÏ¡£ÏÂͼµÄʵÑé½á¹ûÔÙ´ÎÓ¡Ö¤ÁËdLLM-CacheÒªÁìµÄÓÐЧÐÔ£¬³ä±ç°×Ã÷ÁËÆäͨÓÃÓÚÖ÷Á÷dLLM¼Ü¹¹

ͼ6 dLLM-CacheÔÚDreamÄ£ÐÍÉϵÄЧ¹û

×÷Õß»¹½«dLLMºÍÖ÷Á÷µÄ»ùÓÚARMµÄLLM½øÐÐÁ˱ÈÕÕ£¬ÏÂͼչʾÁËLLaDA 8BÓëLLaMA3 8BÔÚGSM8KÈÎÎñÉϵıȽÏ¡£½á¹ûÏÔʾ£¬Ô­Ê¼µÄLLaDAÔÚ׼ȷÂÊÉÏÒÔ½ü20¸öµãµÄ¾Þ´óÓÅÊÆÁìÏÈÓÚLLaMA3£¬µ«ÔÚÍÆÀíËÙ¶ÈÉÏȴԶȱ·¦¡£È»¶ø£¬ÔÚʹÓÃÁ˱¾ÎĵÄdLLM-CacheÖ®ºó£¬LLaDAµÄÍÆÀíËÙ¶È»ñµÃÁËÁè¼Ý3.3±¶µÄÌáÉý£¬Ê×´ÎÁè¼ÝÁËLLaMA3µÄÍÆÀíËÙ¶È¡£ÕâÒ»½á¹ûÓÐÁ¦µØÖ¤Ã÷£¬±¾ÎÄÌá³öµÄdLLM-CacheÄܹ»ÈÃdLLMsÔÚ¼á³ÖÆäÏÔÖø×¼È·ÂÊÓÅÊÆµÄͬʱ£¬»ñµÃÓëARMsÏ൱¾ºÕùÁ¦µÄÍÆÀíËÙ¶È

ͼ7 ʹÓÃdLLM-CacheµÄdLLM vs ʹÓÃKV-CacheµÄARM

ÂÛÎÄÁ´½Ó£º https://github.com/maomaocun/dLLM-cache/blob/main/asset/paper.pdf´úÂëÒÑ¿ªÔ´£º https://github.com/maomaocun/dLLM-Cache

Ïà¹ØÍÆ¼ö£º成人做爰黄✌片免费观看鲸鱼🐳 老胖熊同性Gay互吃 班长给我看🐻

·ÖÏí£º 2025-06-02 17:25:25 ¹²81¿î

µçÄÔ

°²×¿

Æ»¹û

Ïà¹ØºÏ¼¯

ÍøÓÑÆÀÂÛ ¼ì²ìËùÓÐÆÀÂÛ>>

Ðû²¼ÆÀÂÛ

(ÄúµÄÆÀÂÛÐèÒª¾­¹ýÉóºË²Å»ªÏÔʾ) ÍøÓÑ·ÛË¿QQȺºÅ:766969941

¼ì²ìËùÓÐ0ÌõÆÀÂÛ>>

ÍøÕ¾µØÍ¼