¿­·¢ÌìÉúÓ®¼ÒÒ»´¥¼´·¢Ê×Ò³

ËÑË÷ èÑÛÓ°Ï· ÈÚýÌ徨Õó
  • ɽ¶«ÊÖ»ú±¨

  • èÑÛÓ°Ï·

  • ¹«¹²Íø¹Ù·½Î¢ÐÅ

  • ¹«¹²Íø¹Ù·½Î¢²©

  • ¶¶Òô

  • ÈËÃñºÅ

  • È«¹úµ³Ã½Æ½Ì¨

  • ÑëÊÓÆµ

  • °Ù¼ÒºÅ

  • ¿ìÊÖ

  • Í·ÌõºÅ

  • ßÙÁ¨ßÙÁ¨

Ê×Ò³ >ÐÂÎÅ >Éç»áÐÂÎÅ

ÆÈ½üClaude 3.5¡¢±¾Ç®½µµÍ86%£¬¿ªÔ´´úÂ붨λÐÂÉñÆ÷LocAgentÀ´ÁË

2025-06-01 08:38:41
À´Ô´£º

èÑÛÓ°Ï·

×÷Õߣº

宋善美

ÊÖ»ú¼ì²ì

¡¡¡¡Ã¨ÑÛÓ°Ï·¼ÇÕß 米凯拉·斯特恩 ±¨µÀw3u7903ejky2ywls

ÓÖÊÇÒ»¸öÈóÌÐòÔ±¿ñ»¶µÄÑо¿£¡À´×Ô OpenHands¡¢Ò®Â³¡¢ÄϼӴóºÍ˹̹¸£µÄÑо¿ÍŶӸոÕÐû²¼ÁËLocAgent¡ª¡ª Ò»¸öרÃÅÓÃÓÚ´úÂ붨λµÄͼË÷Òý LLM Agent ¿ò¼Ü£¬Ö±½Ó°Ñ´úÂ붨λ׼ȷÂÊÀ­µ½ÁË 92.7% µÄи߶È¡£¸ÃÑо¿Òѱ» ACL 2025 ¼Óá£

ÂÛÎÄÌâÄ¿£ºLocAgent: Graph-Guided LLM Agents for Code LocalizationÂÛÎÄÁ´½Ó£ºhttps://arxiv.org/abs/2503.09089´úÂëÁ´½Ó£ºhttps://github.com/gersteinlab/LocAgent

Ò»¡¢Í´µãºÜÕæÊµ£º´úÂ붨λ¾¿¾¹ÓжàÔÖ£¿

ÏàÐÅÿ¸ö³ÌÐòÔ±¶¼ÓйýÕâÑùµÄ¾­Àú£º¿´µ½Ò»¸ö bug ±¨¸æ£¬ÂúÁ³ÎʺŵØÏ롸Õ⾿¾¹Òª¸ÄÄÄÀ¡¹¡£¹Å°åÒªÁìҪô¿¿Òªº¦´ÊÆ¥Å䣨̫´Ö²Ú£©£¬ÒªÃ´Ö±½Ó°ÑÕû¸ö´úÂë¿â¶ª¸ø LLMs£¨Ì«µÍЧ£©£¬ÒªÃ´Èà Agent äĿ±éÀúĿ¼£¨Ì«ð¯×¾£©¡£

ÎÊÌâµÄ½¹µãÔÚÓÚ£º×ÔÈ»ÓïÑÔÃèÊöµÄÎÊÌâºÍÕæÕýÐèÒªÐÞ¸´µÄ´úÂëλÖÃÖ®¼ä£¬ÍùÍù¸ôןü¸²ãŲÓùØÏµ¡£ºÃ±ÈÓû§·´Ï졸XSS ©¶´¡¹£¬µ«Êµ¼ÊÐèÒªÐ޸ĵĿÉÄÜÊÇij¸öÉî²ãµÄÑéÖ¤¹¤¾ßº¯Êý¡£

»»ÑÔÖ®£¬´úÂ붨λָµÄÊÇÔÚ´óÐÍ´úÂë¿âÖо«È·ÕÒµ½ÐèÒªÐ޸ĵĴúÂëλÖã¬ÔÚÈí¼þ¿ª·¢Óëά»¤ÖУ¬×¼È·µØ¶¨Î»´úÂëÎÊÌâÊÇÌá¸ß¿ª·¢Ð§ÂʵÄÒªº¦£¨Í¼ 1 չʾÁËËÄÖÖ³£¼ûµÄ´úÂëÐÞ¸´³¡¾°£©¡£

ͼ 1£º¸ø¶¨Ò»¸ö´úÂë¿â£¨×󣩺ÍÎÊÌâÃèÊö£¨ÖУ¬°üÀ¨ËÄÖÖ³¡¾°µÄʾÀý£©£¬´úÂ붨λÐèҪʶ±ð³öÐèÒªÐ޸ĵÄÏà¹Ø´úÂëλÖã¨ÓÒ£©£¬°üÀ¨¾ßÌåµÄÎļþ¡¢ÀàºÍº¯Êý¡£LocAgent Ö¼ÔÚÈà LLM Agent ×Ô¶¯Íê³ÉÕâÒ»Àú³Ì¡£

×ÔÈ»ÓïÑÔÖеÄÎÊÌâÃèÊö£¨Èç¹ýʧ±¨¸æ£©ÍùÍùÓëÕæÕýµÄ¹ÊÕϸùÒò±£´æÏÔÖøµÄÓïÒå²î±ðÓë½á¹¹¾àÀ루Èçͼ 2 Ëùʾ£©¡£Õâ²»µ«ÒªÇóÄ£ÐÍÄܹ»ÉîÈëÀí½â×ÔÈ»ÓïÑÔ±àдµÄ¹ýʧ±¨¸æ£¬»¹Ðè¾ß±¸ÔÚÅÓ´ó´úÂë¿âÖпçÔ½²ã¼¶½á¹¹ºÍÅÓ´óÒÀÀµ¹ØÏµ½øÐÐÍÆÀíºÍ×·×ÙµÄÄÜÁ¦¡£

ͼ 2: ͼÖкìÉ«½ÚµãÌåÏÖÎÊÌâÃèÊöÖÐÃ÷È·Ìá¼°µÄº¯Êý£¬»ÆÉ«½ÚµãÌåÏÖʵ¼ÊÐèÒªÐ޸ģ¨ÐÞ²¹£©µÄº¯Êý¡£ÈÎÎñÄѶȽç˵Ϊ´úÂëͼÖдÓÌá¼°º¯Êýµ½Ä¿±êÐÞ²¹º¯ÊýÖ®¼äµÄ×î¶Ì·¾¶³¤¶È£¨×îÉÙÌøÊý£©£¬Í¼Ê¾ÀýÖÐÈÎÎñÄѶÈΪ 2 Ìø¡£

¶þ¡¢LocAgent£º¸ø LLM ×°ÉÏ¡¸´úÂëµØÍ¼¡¹

¸ÃÑо¿ÍŶӵĽâ¾ö¼Æ»®Ï൱ÇÉÃÊ×ÏÈËûÃǰÑÕû¸ö´úÂë¿â½âÎö³ÉÒ»ÕÅͼ£¬°üÀ¨Îļþ¡¢Àà¡¢º¯ÊýÖ®¼äµÄ°üÀ¨¡¢Å²ÓᢼÌÐø¡¢µ¼Èë¹ØÏµ¡£È»ºó¸ÃÍŶÓΪ LLM Agent Ìṩ¼ò½àͳһµÄͼԭÓï½Ó¿Ú£¬ÒÔÖ§³ÖÀëЧ̽Ë÷´úÂë¿â¡£¸ÃÒªÁìͨ¹ý½«´úÂë¿â½âÎöΪÒ칹ͼÌåÏÖ£¬ÈôóÓïÑÔÄ£ÐÍÄܹ»ÏñʹÓõØÍ¼Ò»Ñù¸ßЧµØÔÚ´úÂëÖС¸Òƶ¯¡¹£¬ÊµÏÖ¶àÌøÍÆÀí£¬Öð²½½Ó½üÄ¿±ê´úÂë¡£

ͼ 3£ºLocAgent ¿ò¼Ü¸ÅÀÀ

Èçͼ 3 Ëùʾ£¬LocAgent Ê×ÏȽ«´úÂë¿â½âÎöΪһ¸öÒ칹ͼÌåÏÖ£¬Í¼ÖаüÀ¨¶àÖÖÀàÐ͵ĴúÂëʵÌå¼°ÆäÒÀÀµ¹ØÏµ¡£ÔÚ´Ë»ù´¡ÉÏ£¬ÏµÍ³¹¹½¨ÁË·Ö²ãÏ¡ÊèË÷Òý£¬ÓÃÓÚÖ§³Ö¸ßЧµÄÄÚÈݼìË÷Óë½á¹¹»¯Ì½Ë÷¡£½èÖúÕâЩË÷Òý£¬LocAgent Äܹ»½áºÏͼ½á¹¹Ó빤¾ß½Ó¿Ú£¬Ö´ÐÐÓÉ Agent Çý¶¯µÄÖð²½ËÑË÷Àú³Ì£¬¾«×¼Íê³É´úÂ붨λÈÎÎñ¡£

2.1 ´úÂëÌåÏÖ¹¹½¨Àú³Ì

´úÂëͼÌåÏÖ¹¹½¨£ºÎªÍ³Ò»ÌåÏÖ´úÂë¿âÖеĽṹÓëÓïÒåÐÅÏ¢£¬LocAgent »ùÓÚÁýͳÓï·¨Ê÷£¨AST£© ¶Ô´úÂë¿â½øÐнâÎö£¬¹¹½¨Ò»¸öÒì¹¹ÓÐÏòͼ ×÷Ϊ½á¹¹»¯Ë÷Òý£¬ÏêϸÌåÏÖÁË´úÂëĿ¼¡¢Îļþ¡¢Àà¡¢º¯ÊýÖ®¼äµÄ°üÀ¨¡¢Å²Óᢵ¼ÈëºÍ¼ÌÐø¹ØÏµ£¬Ê¹µÃÒþʽÒÀÀµÏÔÐÔ»¯£¬±ãÓÚ LLM ¸ßÐ§ÍÆÀí¡£

ÕâÖÖͼ½á¹¹µÄÓÅÊÆÔÚÓÚ£º×ÝÈ»Á½¸ö´úÂëÆ¬¶Î·Ö´¦²î±ðÄ£¿é£¬Ö»Òª±£´æÅ²Óûò¼ÌÐø¹ØÏµ£¬ÔÚͼÉÏËüÃǾͻá±äµÃ¡¸ÁÚ½ü¡¹¡£ºÃ±È£¬ÒÔÍù»ùÓÚĿ¼µ¼º½µÄÒªÁì»áÈÏΪԶ¸ôÁ½¸ö×ÓĿ¼µÄÄ£¿é¾ø²»Ïà¸É£¬µ«Èç¹ûÄ£¿é A º¯ÊýŲÓÃÁËÄ£¿é B£¬ÔÚ LocAgent µÄͼÖÐ A ºÍ B »áͨ¹ýŲÓñßÖ±½ÓÁ¬½Ó£¬Ê¹ËüÃÇÔÚ¸Ãͼ½á¹¹ÉÏ¿¿½ü¡£¹ØÓÚ´úÂ붨λÈÎÎñ£¬ÕâÖÖ¡¸ÁÚ½ü¡¹ÖÁ¹ØÖØÒª£¬ÒòΪÐí¶àÎÊÌâ²»ÊǾÖÏÞÔÚµ¥¸öÎļþ¼ÐÄÚ²¿£¬¶øÊÇͨ¹ýŲÓÃÁ´¿çÔ½¶à¸öÄ£¿é¡£

2.2 Ìṩ¹¤¾ß½Ó¿Ú¹© Agent ÅÌÎÊ

¹¹½¨ºÃ´úÂëͼºó£¬LocAgent ÌṩÁËͳһµÄ¹¤¾ß½Ó¿Ú£¬Èà LLM Agent Äܹ»±ãµ±ÍÁµØÎÊͼ½á¹¹ºÍ´úÂëÄÚÈÝ¡£Ö÷Òª°üÀ¨ÒÔÏÂÈý¸ö API£º

SearchEntity£º¸Ã¹¤¾ß»ùÓÚÌõÀí»¯ÊµÌåË÷Òý£¬Ê¹ÓÃÒªº¦´ÊËÑË÷´úÂë¿âÖÐÏà¹ØÊµÌå¡£µ±ÔÚÉϲãË÷ÒýÖÐδÄÜÕÒµ½Æ¥ÅäÏîʱ£¬ÏµÍ³»á×Ô¶¯Ê¹ÓÃÏÂÒ»²ãË÷Òý½øÐÐËÑË÷£¬´Ó¾«È·Æ¥Å䵽ģºýËÑË÷£¬ÒÔ²éÕÒ×î½Ó½üµÄÆ¥ÅäÏî¡£¹ØÓÚ¼ìË÷µ½µÄÿ¸öʵÌ壬SearchEntity »á·µ»Ø¸Ã´úÂëÆ¬¶ÎµÄÕªÒª£¨Èçͼ 4£¬ÓÐÕÛµþ¼¶±ð¡¢Ô¤ÀÀ¼¶±ðºÍÍêÕû´úÂëÈý¼¶£¬¿Éƾ¾ÝÐèÒªÕ¹¿ª£©¡£

ͼ 4: Ϊ¸ßЧµÄ Agent ´úÂë½»»¥¶øÉè¼ÆµÄ²î±ðÊäÌØ±ðʽʾÀý¡£

RetrieveEntity£ºµ± Agent È·¶¨ÁËij¸ö´úÂëʵÌåºÜ¿ÉÄܾÍÊÇÄ¿±êʱ£¬¿ÉÒÔÓô˹¤¾ßÌáÈ¡¸ÃʵÌåµÄÍêÕûÐÅÏ¢¡£µ±ÊäÈëʵÌå ID£¬RetrieveEntity Êä³ö¸ÃʵÌåµÄÎļþ·¾¶¡¢ÆðÖ¹Ðкš¢ÍêÕû´úÂëÄÚÈݵÈÏêϸÊôÐÔ¡£TraverseGraph£º¸Ã¹¤¾ßÔÚ´úÂëͼÉÏÖ´ÐÐÀàÐ͸ÐÖªµÄ¹ã¶ÈÓÅÏÈËÑË÷¡£Agent ¿ÉÒÔÖ¸¶¨ÆðʼµÄʵÌå ID£¬ÒÔ¼°Ï£Íû±éÀúµÄÆ«Ïò¡¢²½Êý£¨hops£©¡¢ÊµÌåÀàÐͺ͹ØÏµÀàÐ͵ȲÎÊý¡£¹¤¾ß»áÔÚͼÖÐ´ÓÆðµã³ö·¢Æ¾¾ÝÒªÇó×ßÖ¸¶¨²½Êý£¬·µ»Ø±éÀúµ½µÄ×Óͼ½á¹¹¡£Í¨¹ýÉèÖòî±ðµÄÀàÐ͹ýÂË£¬Agent ¿ÉÒÔÁé»îµØÌ½Ë÷ºÃ±È¡¸ÑØÅ²ÓùØÏµÏòÏÂ×·×ÙÁ½²½¡¹»ò¡¸¼ì²ì´ÓijÀà³ö·¢µÄ¼ÌÐøÌõÀí¡¹µÈµÈ¡£ÖµµÃÒ»ÌáµÄÊÇ£¬TraverseGraph ½«·µ»ØµÄ×Óͼ»¨Ñù»¯³ÉÒ»ÖÖÊ÷×´½á¹¹Îı¾£¨¼ûͼ 5£©£¬ÒÔ±ã LLM ¸üÈÝÒ×Àí½â¹ØÏµÍØÆË¡£

ͼ 5£ºTraverseGraph ¹¤¾ßÊä³öʾÀý¡£

2.3 Agent Çý¶¯µÄÍÆÀí½×¶Î

LocAgent ÔÚÌáʾÉè¼ÆÉϽÓÄÉÁË¡¸Öð²½Ë¼¿¼¡¹(Chain-of-Thought, CoT) µÄÕ½ÂÔ£¬Òýµ¼ LLM Agent ½«´úÂ붨λÈÎÎñÆÊÎöΪһϵÁа취£¬Ä£ÄâÈËÀàµ÷ÊÔ˼·һ²½²½ÆÈ½üÄ¿±ê¡£Õû¸öÎÊÌâÇó½âÀú³Ì¿ÉÒÔ¸ÅÀ¨ÎªÒÔϽ׶Σº

ÎÊÌâÀí½âÓëÒªº¦´ÊÌáÈ¡£ºAgent Ê×ÏȶÔÊäÈëµÄ issue ÃèÊö½øÐÐÆÊÎö£¬»®·Ö³ö²î±ð·½ÃæµÄÐÅÏ¢£¬È»ºóÌáÈ¡³öÓëÎÊÌâÏà¹ØµÄÒªº¦´Ê¡£ÕâЩҪº¦´ÊÏ൱ÓÚΪºóÐøËÑË÷Ö¸Ã÷ÁË¿ª¶ËÆ«Ïò¡£Á´½ÓÒªº¦´Êµ½´úÂëʵÌ壺Õë¶Ôÿ¸öÌáÈ¡µÄÒªº¦´Ê£¬Agent ŲÓà SearchEntity ¹¤¾ßÔÚ´úÂëË÷ÒýÖвéÕÒÆ¥ÅäµÄ´úÂëʵÌå¡£¶àÌøÍÆÀí£¬Éú³É¹ÊÕÏÁ´Â·£º½ÓÏÂÀ´£¬Agent »áʵÑé´®ÁªÏßË÷£¬´Ó±¨´í±íÕ÷ÍÆµ¼¹ÊÕÏÔ­Òò¡£ËüÏÈÈ·¶¨ÎÊÌâ´¥·¢µÄ³õʼÈë¿Úµã£¨ÀýÈç´¥·¢¹ýʧµÄ API »òº¯Êý£©£¬È»ºóÒÔÕâЩµãΪÆðµã£¬ÔÚ´úÂëͼÉϽøÐеü´ú̽Ë÷£ºÅ²Óà TraverseGraph ÑØÅ²ÓùØÏµ»òÒÀÀµ¹ØÏµÏòÏà¹ØÆ«ÏòËÑË÷£»Óà RetrieveEntity ¼ì²ìijЩҪº¦½ÚµãµÄʵÏÖϸ½Ú£»ÐëҪʱÔÙ´Î SearchEntity ÒýÈëеÄÒªº¦´Ê¡£Í¨¹ý¶àÂÖ½»ÌæÊ¹ÓÃÕâЩ¹¤¾ß£¬Agent Öð²½¹¹½¨ÆðÒ»Ìõ´ÓÎÊÌâÖ¢×´µ½Ç±ÔÚ¸ùÒòµÄÂß¼­Â·¾¶¡£Ëø¶¨Ä¿±ê´úÂ룺ÔÚÐγɶÔÎÊÌâµÄÈ«ÃæÀí½âºó£¬Agent ƾ¾Ý¡¸¹ÊÕÏÁ´Â·¡¹ÖÐ̻¶µÄ¿ÉÒÉ»·½Ú£¬¶¨Î»³öËùÓпÉÄÜÐèÒªÐ޸ĵÄÄ¿±ê´úÂëʵÌ壨¿ÉÄÜÊÇÈô¸É¸öº¯Êý»òÀࣩ¡£Ëæºó£¬Agent ¶ÔÕâЩºòѡʵÌå°´Ïà¹ØÐÔ½øÐÐÅÅÐòÊä³ö£¬²¢¸ø³öËüÃǵÄÎļþ·¾¶ÒÔ¼°¼òÒªµÄÔ­Òò˵Ã÷¡£

Õû¸ö LocAgent µÄʹÓöÔÓû§À´ËµºÜÊǼò½à£ºÖ»ÐèÊäÈë×ÔÈ»ÓïÑÔµÄÎÊÌâÃèÊö£¬ LLM Agent ¾Í»áÈçÉÏËùÊö×ÔÖ÷µØÍê³ÉһϵÁÐËÑË÷¡¢±éÀú¡¢¶ÁÈ¡²Ù×÷£¬×îºó¸ø³ö´úÂ붨λ½á¹û¡£

Èý¡¢ÊµÑé½á¹û£ºÕæÏ㾯¸æ

LocAgent ÔÚÕæÊµÊý¾Ý¼¯ÉϵÄÌåÏÖºÍÆÊÎö½á¹ûÁîÈËÖõÄ¿¡£Ñо¿ÖÐʹÓÃÁ˼ÈÓеĻù×¼Êý¾Ý¼¯£¨SWE-Bench Lite£©ÒÔ¼°ÍŶÓй¹½¨µÄ Loc-Bench£¬±ÈÕÕÁ˶àÖÖ»ùÏßÒªÁìµÄ´úÂ붨λЧ¹û¡£

£¨1£©´úÂ붨λЧ¹û¾«²Ê

SWE-Bench Lite ÊÇ´Ó GitHub issue Öй¹½¨µÄ»õ²Ö¼¶´úÂëÐÞ¸´Êý¾Ý¼¯£¬Ò²³£ÓÃÓÚ´úÂ붨λÆÀ¹À£¬°üÀ¨ 300 ¸öÎÊÌâ¼°Æä¶ÔÓ¦µÄÐÞ¸´´úÂ룬ÆäÖд󲿷ÖΪ bug ±¨¸æ¡£»ùÓڸûù×¼£¬LocAgent ʵÏÖÁËĿǰ×îÓŵĴúÂ붨λ׼ȷÂÊ£¬ÏÔÖøÓÅÓÚÏÖÓÐÒªÁì¡£

Ïà±È¹Å°åµÄÏòÁ¿¼ìË÷ÒªÁìÓÐÏÔÖøÌáÉý£ºBM25 ÔÚÎļþ¼¶ Acc@5 ÉϽöΪ 61.7%£¬¶øÏȽøµÄ´úÂëǶÈëÄ£ÐÍÈç CodeRankEmbed Ò²½öµÖ´ï 84.7%£»¶ø LocAgent ׼ȷÂʸߴï 92.7%£¬ÔÚº¯Êý¼¶¶¨Î»ÖÐҲͬÑùÏÔÖøÓÅÓÚÕâЩҪÁì¡£¶à²½ÍÆÀíµÄ Agent ÀàÒªÁìÕûÌåÉÏʤ¹ý»ùÓÚÀιÌÁ÷³ÌµÄÒªÁì¡£»ùÓÚÀιÌÁ÷³ÌµÄÒªÁ죨Èç Agentless£©ÍùÍùÖ»ÄÜÒÀ¾Ý×ÖÃæÆ¥ÅäÕÒµ½ÓÐÏ޵ĺòÑ¡£¬¶øÒýÈëÁË Agent Öð²½Ì½Ë÷ºó£¬Äܹ»¿¼ÂǸü¹ãµÄ¹æÄ££¬¶¨Î»Ð§¹û¸üºÃ¡£ÔÚÎļþ¡¢Ä£¿é¡¢º¯ÊýÈý¸öÁ£¶ÈÉÏ£¬LocAgent È«ÃæÓâÔ½ÁË»ùÓÚ GPT-4o »ò Claude-3.5 µÄÏÖÓÐ Agent ϵͳ¡£Ê¹Óà Claude-3.5 ʱ£¬LocAgent ÔÚ SWE-Bench Lite Îļþ¼¶ Acc@5 µÖ´ï 94%£¬ÔÚº¯Êý¼¶¶¨Î»ÉÏͬÑùÓÅÓÚÆäËûÒªÁì¡£LocAgent ´îÅä Qwen2.5-32B (΢µ÷) Ä£Ð͵ÄÐÔÄÜÏÕЩÓë Claude-3.5 ³Öƽ£ºÔÚ SWE-Bench Lite Îļþ¼¶ Top-5 ׼ȷÂÊÉÏ£¬Ç°ÕßΪ 92.7%£¬ºóÕßÔ¼ 94.2%£¬²î±ðºÜС¡£¶øÈç¹ûʹÓà Qwen2.5-7B (΢µ÷) СģÐÍ£¬ËäȻ׼ȷÂÊÂÔÓÐϽµ£¨Ô¼ 88.3%£¬µ«ÈÔÁè¼Ý¾ø´ó´ó¶¼ baseline£©£¬ÆäÌåÏÖÒÑÄܹ»ÆÈ½ü GPT-4o µÄЧ¹û¡£

£¨2£©¶àÈÎÎñ³¡¾°Ïµķº»¯ÄÜÁ¦

ÓÉÓÚ SWE-Bench Lite Êý¾Ý¼¯¹ýÓÚÆ«ÖØ Bug ÀàÐÍ£¬ÍŶӴòÔìÁËеÄLoc-Bench»ù×¼£¬ÓÃÓÚÈ«ÃæÆÀ¹ÀÒªÁìÔÚ¶àÑù»¯Èí¼þά»¤ÈÎÎñÖеĶ¨Î»ÄÜÁ¦¡£Loc-Bench ¹²°üÀ¨ 560 ¸öÕæÊµ GitHub issue£¬ÁýÕÖBug ÐÞ¸´¡¢¹¦Ð§ÐÂÔö¡¢Äþ¾²Â©¶´ÓëÐÔÄÜÓÅ»¯ËÄ´óÀ࣬ÈÎÎñÀàÐÍÔ½·¢¾ùºâ£¬Ìù½üʵ¼Ê¹¤³Ì³¡¾°¡£

ËÄ¡¢¿ªÔ´¸£Àû£ºÐ¡Ä£ÐÍÒ²ÄÜ´ò

Õâ¸öÑо¿×îÈÃÈËÐ˷ܵĵط½ÔÚÓÚ£º¿ªÔ´Ä£Ð;­¹ý΢µ÷ºó£¬Ò²ÄִܵïÉÌÓôóÄ£Ð͵ÄЧ¹û¡£ËûÃÇÌṩÁËÁ½¸ö°æ±¾£¬1. Qwen2.5-7B ΢µ÷°æ£ºÐÔÄÜæÇÃÀ GPT-4o£¬µ¥´Î´¦Àí±¾Ç®½ö $0.05£»2.Qwen2.5-32B ΢µ÷°æ£ºÆÈ½ü Claude-3.5 ˮƽ£¬±¾Ç®½ÚÊ¡ 86%¡£Õâ¹ØÓÚÐèÒª´ó¹æÄ£°²ÅŵįóÒµÀ´Ëµ£¬Õâ¼òÖ±Êǽµ±¾ÔöЧµÄÉñÆ÷¡£

¾ßÌå¶øÑÔ£¬Î¢µ÷µÄ Qwen2.5-7B Ä£ÐÍ£¬LocAgent ÔÚ Loc-Bench ËÄÀೡ¾°ÏÂµÄÆ½¾ùÎļþ¼¶ Acc@5 Ϊ76.8%£¬º¯Êý¼¶ Acc@15 Ϊ46.9%£¬Òѽӽü SWE-Agent ´îÅä Claude-3.5 µÄÌåÏÖ£¨ºóÕߺ¯Êý¼¶Ô¼ 45.4%£©¡£½øÒ»²½½« LocAgent Óë Claude-3.5 ½áºÏºó£¬Îļþ¼¶Æ½¾ù׼ȷÂÊ¿ÉÌáÉýÖÁ81.1%£¬ÔÚËÄÀàÈÎÎñÖÐÏÕÐ©È«ÃæÓâÔ½ÆäËûÒªÁì¡£

Î塢ʵ¼ÊÓ¦Ó㺲»¿ÉÊǶ¨Î»£¬»¹ÄÜÖúÁ¦½â¾öÎÊÌâ

Ñо¿ÍŶÓÑéÖ¤ÁËÒ»¸öÒªº¦µã£º¸ü׼ȷµÄ´úÂ붨λֱ½ÓÌáÉýÎÊÌâ½â¾öÂÊ¡£ÔÚ GitHub ÎÊÌâ×Ô¶¯ÐÞ¸´ÈÎÎñÖУ¬Ê¹Óà LocAgent µÄ Pass@10 ÀÖ³ÉÂʱȻùÏßÒªÁìÌáÉýÁË 12%¡£ÕâÒâζ×ÅÕâÏî¼¼Êõ²»µ«½öÊǸö¡¸¶¨Î»¹¤¾ß¡¹£¬¶øÊÇÄÜʵʵÔÚÔÚÌáÉýÕû¸öÈí¼þά»¤Á÷³ÌЧÂʵÄÀûÆ÷¡£

¸ÃÍŶӽøÒ»²½´Ó²î±ð½Ç¶ÈÕ¹¿ªÆÊÎö£¬Ì½ÌÖÆäÔÚÅÓ´óÈÎÎñÖеÄÎȶ¨ÐÔ¡¢±¾Ç®Ð§ÂÊ¡¢Òªº¦×é¼þ×÷ÓÃÒÔ¼°¶ÔÏÂÓÎÓ¦ÓõÄʵ¼Ê¼ÛÖµ¡£

£¨1£©ÄѶȷּ¶ÊµÑéÓë¶àÌøÂ³°ôÐÔ

ΪÁËÉîÈëÁ˽â LocAgent µÄÄÜÁ¦£¬¸ÃÍŶӻ¹Æ¾¾ÝÈÎÎñµÄÄѶȶÔÐÔÄܽøÐÐÁËÆÊÎö¡£¸ÃÍŶӽ«¡¸ÄѶȡ¹ÓôúÂëͼÉϺ¯Êý¾àÀ루hop Êý£©À´È¨ºâ£º¼´ Issue ÃèÊöÖÐÌá¼°µÄº¯ÊýÓëʵ¼ÊÐèÒªÐ޸ĵĺ¯ÊýÖ®¼äµÄ×î¶Ì·¾¶¡£Ö±¹ÛµØËµ£¬hop=0 ÌåÏÖ Issue Ö±½ÓÌáµ½ÁËÐèÒª¸ÄµÄº¯ÊýÃû£»hop=1 ÌåÏÖÄ¿±êº¯ÊýÊÇ Issue ÖÐÌáµ½µÄº¯ÊýÖ®¼äÓÐÖ±½Ó¹ØÏµ£¬hop ÊýÔ½´óÔò¶¨Î»ÄѶÈÔ½¸ß¡£

ʵÑé·¢Ã÷£ºËæ×Å hop ÊýÔö¼Ó£¬ËùÓÐÒªÁìµÄ¶¨Î»×¼È·Âʶ¼ÔÚϽµ¡£¾¿¾¹¹ØÁªÔ½²»Ö±¹Û£¬Ä£ÐÍÐèÒªÍÆÀíµÄÁ´Â·¾ÍÔ½³¤¡£²»¹ý£¬²î±ðÒªÁìµÄ³°ôÐÔ²î±ðÃ÷ÏÔ£ºAgent ÀàÒªÁìÔÚ¸ßÄѶÈϵÄÐÔÄÜϽµ·ù¶ÈÃ÷ÏÔСÓÚ¼ìË÷ÀàÒªÁì¡£ÌرðÊÇ LocAgent ½èÖúͼ½á¹¹Ë÷Òý£¬ÔÚ hop ÊýÔö¼ÓʱÈÔÄܼá³ÖÏà¶Ô½Ï¸ßµÄ׼ȷÂÊ£¬ÌåÏÖ³ö½ÏºÃµÄ³°ôÐÔ¡£

Ïà±È֮ϣ¬¹Å°å¼ìË÷ÒªÁìÔÚÐèÒªÁ½ÌøÒÔÉÏʱÏÕЩʧЧ£¬ÔÚº¯Êý¼¶¶¨Î»ÉÏ×ÝȻĿ±êº¯ÊýÃû×־ͷºÆðÔÚÅÌÎÊÀÓÐʱ¶¼ÕÒ²»µ½£¨ÒòΪËüÃÇÍùÍù°ÑÅÌÎʵ±×öÕûÌ壬ÎÞ·¨²ð½â´¦Àíϸ½Ú£©¡£

£¨2£©Ð§¹ûÓ뱾Ǯ±È½Ï

½èÖú½á¹¹»¯Í¼Ë÷ÒýÓ빤¾ßŲÓã¬LocAgent ½öÐè 6¡«9 ÂÖ½»»¥¼´¿ÉÍê³ÉÒ»´Î´úÂ붨λÈÎÎñ£¬ÍÆÀíÀú³Ì¸ßЧ¡£±ðµÄ£¬¸ÃÍŶÓÀûÓÿªÔ´Ä£ÐÍÈ¡µÃÁËæÇÃÀÉÌÓôóÄ£Ð͵Ľá¹û£¬Í¬Ê±´ó·ù½µµÍÍÆÀí±¾Ç®£¬¾ß±¸Êµ¼ÊÂ䵨°²ÅŵĿÉÐÐÐÔ¡£

¾ßÌåÀ´¿´£¬Ê¹Óà Claude-3.5 µÈÉÌÓà API Ä£ÐÍʱ£¬Ã¿¸ö Issue µÄƽ¾ù´¦Àí±¾Ç®Ô¼Îª$0.66£»¶øÊ¹ÓÃÍâµØ°²ÅÅµÄ Qwen2.5-32B Ä£ÐÍ£¬±¾Ç®½µÖÁÔ¼$0.09£¬½µµÍÁË86%¡£Èô½øÒ»²½½ÓÄÉ 7B µÄСģÐÍ£¬´¦Àí±¾Ç®¿ÉµÍÖÁ$0.05£¬ÈÔÄܼá³ÖÓÅÓÚ´ó´ó¶¼ÒªÁìµÄÐÔÄÜ¡£´Óº¯Êý¼¶×¼È·ÂÊÓ뱾ǮµÄ±ÈÖµÀ´¿´£¬Î¢µ÷ºóµÄQwen-2.5-7B ÊÇÐÔ¼Û±È×î¸ßµÄ¼Æ»®£¬ÆäЧÂÊÓÅÓÚËùÓÐÉÌÓÃÄ£ÐÍ£»Qwen-2.5-32B ´ÎÖ®£¬Ò²ÏÔÖøÓÅÓÚ Claude-3.5¡£Õâ±êÃ÷£¬½áºÏ LocAgent ¿ò¼Ü£¬¿ªÔ´Ä£ÐͲ»µ«¾ß±¸ÐÔÄܾºÕùÁ¦£¬¸ü¾ß°²Åž­¼ÃÐÔ¡£

£¨3£©Ó¦ÓÃЧ¹û£º¸ßÖÊÁ¿¶¨Î»ÏÔÖøÌáÉýÎÊÌâ½â¾öÂÊ

ΪÆÀ¹À´úÂ붨λÔÚʵ¼ÊÈí¼þά»¤ÈÎÎñÖеÄÓ°Ï죬¸ÃÍŶӽøÒ»²½ÆÊÎöÁË LocAgent ÔÚ×Ô¶¯½â¾ö GitHub ÎÊÌâÖеÄЧ¹û¡£½á¹û±êÃ÷£¬Ëæ×Ŷ¨Î»×¼È·ÂʵÄÌáÉý£¬ÎÊÌâ½â¾öÀÖ³ÉÂÊÏÔÖøÌá¸ß£¬ËµÃ÷¸ü¾«×¼µÄ¶¨Î»½á¹ûÄܹ»ÏÔÖøÔöÇ¿×Ô¶¯»¯´úÂëÐ޸ĵÄÖÊÁ¿ÓëÎȶ¨ÐÔ¡£¸Ã·¢Ã÷ÑéÖ¤ÁË LocAgent ²»µ«ÔÚ¶¨Î»×Ô¼ºÌåÏÖÓÅÐ㣬ҲÄÜÓÐÐ§ÍÆ¶¯ÏÂÓÎÈÎÎñµÄÕûÌåÐÔÄÜ£¬¾ß±¸Êµ¼Ê¹¤³Ì¼ÛÖµ¡£

Áù¡¢¼¼ÊõÆôʾ£º½á¹¹»¯Ë÷Òý + ÖÇÄÜÍÆÀí

LocAgent µÄÀֳɽÒʾÁËÒ»¸öÖØÒªÇ÷ÊÆ£º´Ó¡¸±©Á¦ÅÌË㡹µ½¡¸ÖÇÄܾö²ß¡¹µÄ·¶Ê½×ª±ä¡£¹Å°åÒªÁìҪô°ÑÕû¸ö´úÂë¿âÖ±½Ó¶ª¸ø LLM ½øÐб©Á¦Æ¥Å䣬ҪôÈà Agent ƾ¾ÝÔ¤Éè¹æÔòäĿ±éÀúĿ¼£¬ÕâЩ¶¼ÊôÓÚ¡¸ÅÌËãÃܼ¯ÐÍ¡¹µÄ½â¾ö¼Æ»®¡£¶ø LocAgent ͨ¹ýͼË÷ÒýµÈ½á¹¹»¯ÖмäÌåÏÖ£¬½«ÅÓ´óÎÊÌâ½øÐнṹ»¯ÆÊÎö£¬È»ºóÈà LLM µ£¸º¸ü¸ßÌõÀíµÄÍÆÀíºÍ¾ö²ßÈÎÎñ¡£

ÕâÖÖ¡¸agentic retrieval¡¹·¶Ê½µÄ½¹µãÔÚÓÚ¾ö²ßÖÇÄÜ»¯¡£Í¨¹ýͼ¡¢Ê÷µÈ½á¹¹»¯ÖмäÌåÏÖ£¬ÐÅÏ¢±äµÃ¸üÒ×ÓÚÍÆÀí£¬Agent Äܹ»Æ¾¾Ý¾ßÌåÎÊÌ⶯̬µ÷½âËÑË÷Õ½ÂÔ£¬¶ø·ÇËÀ°åµØ×ñÑ­Ô¤Éè·¾¶¡£Õâ´ú±íÁË´Ó¡¸È˹¤Éè¼ÆÖÖÖÖ RAG pipeline¡¹Ïò¡¸Èà AI ×ÔÖ÷¾ö²ßÈçºÎ¼ìË÷¡¹µÄת±ä¡£

ÕâÖÖ½áºÏ½á¹¹»¯Ë÷ÒýÓë LLM ÖÇÄÜÌåЭͬÉè¼ÆµÄ·¶Ê½£¬ºÜ¿ÉÄܳÉΪδÀ´ AI ¹¤³ÌÓ¦Óõıê׼ģʽ¡£²»ÔÙÊÇÈà LLM ×ö¸ü¶àÅÌË㣬¶øÊÇÈà LLM ×ö¸üÖÇÄܵľö²ß - ³ÌÐòÔ±µÄ debugging ÌåÑéÓÖÒªÓ­À´Ò»´ÎÖØ´óÉý¼¶ÁË£¡

??ʱÊÂ1£ºnaruto❌18进禁无尽图片

??06ÔÂ01ÈÕ,为强国建设注入青春动能,

¡¡¡¡ÎÒºÜÐ˷ܼÓÈë½ñÌìÃíÏÂÕò20xxÄêÕò´å¸É²¿Åàѵ°à¡£ ÎÒÊ×ÏÈ´ú±íÊÐίÊÐÕþ¸®²¢ÒÔÎÒ¸öÈ˵ÄÃûÒå¶ÔÃíÏÂÕò20xxÄê¶ÈÕò´å¸É²¿Åàѵ°àµÄ¿ª°àÌåÏÖÈÈÁÒµÄ×£ºØ!

,新疆旱厕高手贴近拍照视频¡£

??06ÔÂ01ÈÕ,去年A股年度现金分红合计2.24万亿元,

¡¡¡¡5¡¢ÒªÅàÑøÇóÕæÎñʵ¡¢Õæ×¥Êµ¸ÉµÄÊÂÇé×÷·ç¡£ÇóÕæÎñʵ£¬¾ÍÊÇ˵ʵ»°¡¢°ìʵÊ¡¢ÇóʵЧ¡£Å©´åϲã¸É²¿Ö»Óн²Õæ»°¡¢½²Êµ»°£¬²Å»áÓ®µÃȺÖÚµÄÐÅÈΣ¬²Å»ªÁ쵼ȺÖÚÒ»µÀ¿Ë·þÀ§ÄÑ£¬½â¾öÎÊÌâ¡£ÎÒÃÇ×öµÄÿһÏîÊÂÇé¶¼Òª´Óʵ¼Ê³ö·¢£¬Òª´ø×ÅÎÊÌâÓëϲãȺÖÚÅäºÏÑо¿ÍâµØµÄ×ÊÔ´×´¿öºÍÓÅÊÆËùÔÚ£¬Ñ°ÕÒÇкÏÍâµØÊµ¼ÊµÄ¾­¼ÃÉú³¤Â·×Ó£¬ÉÌÁ¿Ôö¼ÓÅ©ÃñÊÕÈëµÄ²½·¥¡£Òª´ø×ÅÇé¸ÐӦȺÖÚÖÐÈ¥£¬Õæ³ÏÁ˽âÅ©ÃñȺÖÚµÄÀ§ÄѺÍÔ¸Íû¡¢Òâ¼ûºÍÒªÇó£¬ÕæÐÄʵÒâµØ×ÊÖúȺÖÚÅÅÓǽâÄÑ¡£¸÷ÈËÔÚÅàѵÖÐÒª½áºÏ±¾´å¡¢×Ô¼ºµÄÊÂÇéʵ¼Ê£¬ÈÏÕæË¼¿¼¡¢Ñо¿Ò»ÏÂÈçºÎ²Å»ª×öµ½ÇóÕæÎñʵ?ÔÚÅ©´åϲãÇóÕæÎñʵ¾¿¾¹ÊÇָʲô?Ï£Íûͨ¹ýÅàѵѧϰ˼¿¼ÕÒµ½Ãյס£

,琪亚娜被扒开双腿灌满精子,太宰脱中也内裤把中也淦哭,学生露出🐻让老师玩作文¡£

??ʱÊÂ2£º成人国产AV精品㊙️网站

??06ÔÂ01ÈÕ,全球圈粉!“悟空”IP引爆打卡热潮 周边产品上线“秒空”,

´å¸É²¿Åàѵ°àµÄ ƪ8

,女人疯狂❌喷水爽动图,fuqer100%202,www.猎奇另类.com¡£

??06ÔÂ01ÈÕ,杭州一村民家中闯进200多斤的“大家伙”,民警当场击毙! ,

¡¡¡¡Ç°·½µÄɽµØÓôÓô´Ð´Ð£¬¹Åľ²ÎÌ죬ÓëÊʲŵÄͺɽÐγÉÁËÏÊÃ÷µÄ±ÈÕÕ£¬ÕâÀïÉú»ú²ª²ª£¬²Ýľ·á¸»£¬ÁíÓÐÄñȸ¡¢ÃÍÊ޵ȳöû¡£

,日本伦理电影大妈的爱,动漫同人18❌动漫免费,原神芙宁娜裸体❌开腿照片¡£

??ʱÊÂ3£º大🐔巴摩擦摩擦进去

??06ÔÂ01ÈÕ,西南铁路2024年旅客发送量突破4亿人次,

¡¡¡¡¡°Ð¡²»µãÄãÊÇʲô×öµÄ£¿¡±¶þÃ͵ĸ¸Ç׺ÜÊÇ´ÖáÕÅ×ÅѪÅè´ó¿Ú£¬Ò»×ìÑ©°×µÄÑÀ³Ý£¬µÉ×ÅÍ­Áå´óÑÛ£¬¶ÔËûÓÖÆþÓÖÄó¡£

,日本老师掀裙子撒尿㊙️,我的🍌伸到女同学🍑,被学长抱进小树林c个爽动漫¡£

??06ÔÂ01ÈÕ,11月上旬流通领域重要生产资料市场价格:19种产品价格上涨,

¡¡¡¡¶þÒª³ä·ÖÈÏʶ´å¸É²¿ÊÂÇéµÄ¼è¾ÞÐÔ£¬ÇÐʵÔöÇ¿µ±ºÃ´å¸É²¿µÄѹÁ¦¸ÐºÍ½ôÆÈ¸Ð¡£Ò»¸ö´å¾ÍÊÇÒ»¸öСÉç»á£¬´óµ½Ïç´åÉú³¤µÄºê¹Û¼Æ»®£¬Ð¡µ½¼¦Ã«ËâÆ¤µÄì¶Ü¾À·×£¬È«¿¿´å¸É²¿È¥½â¾öºÍÂäʵ¡£Òò´Ë£¬´å¸É²¿µÄÊÂÇé³ÁÖØ¶ø¼è¾Þ£¬²¢ÇÒÔÚʵ¼ÊÊÂÇéÖл¹½«Ãæ¶ÔÖÖÖÖì¶ÜºÍÀ§ÄÑ¡£Ò»·½Ã棬Ïç´åÄÚ²¿±£´æÒ»Ð©Ã¬¶Ü£¬ºÃ±È¸ÉȺ֮¼äµÄì¶Ü£¬°à×ÓÄÚ²¿µÄì¶Ü£¬×éÓë×é¼°ÁÚÀïÖ®¼äµÄì¶Ü£¬°üÀ¨»»½ìÑ¡¾ÙºóÁôϵÄһЩºóÒÅÖ¢£¬ÕâЩì¶Ü¶¼Òª¿¿¸÷È˵ÄÖǻۺÍÄÜÁ¦È¥»¯½â¡¢È¥ºÍг¡£ÁíÒ»·½Ã棬Ïç´åÉú³¤ÃæÁÙһЩʵ¼ÊÀ§ÄÑ¡£ºÃ±È£¬Ò»Ð©Ïç´å¼¯ÌåÊÕÈë±È½Ï±¡Èõ£¬ÃæÁÙ¡°ÎÞǮЧÀÍ¡±µÄÎÊÌâ¡£Ïç´åûÓÐÇ®Ôõô°ì?×øÔÚ¼ÒÀïµÈÊÇÓÀÔ¶²»»áÓÐÇ®µôÔÚÄãÍ·ÉϵÄ¡£Õâ¾ÍÐèÒª¸÷ÈËÈ¥ÅÜ¡¢È¥ÕÒ£¬ÕÒÕþ²ß¡¢ÕÒÏîÄ¿¡£ÁíÍ⣬ÏîÄ¿Âä»§ºó£¬¾Í±£´æµ÷µØ¡¢²ðǨ¡¢Åâ³¥µÈÎÊÌ⣬ÕâЩÊÂÏî¶¼ºÜÊǵķ±Ëö£¬ÐèÒª¸÷ÈËÓд¦ÀíÎÊÌâµÄÔðÈÎÐÄ¡¢Í»ÆÆ×èÁ¦µÄ¾öÐÄÏ¢Õù¾öÎÊÌâµÄºãÐÄ¡£Òò´Ë£¬Ï£Íû¸÷È˶ÔÀ§ÄÑÔ¤¼ÆµÃÔ½·¢³ä·ÖһЩ£¬×¼±¸ÊÂÇé×öµÃ¸üϸÖÂһЩ£¬²½·¥²½·¥ÏëµÃ¸üÖÜÈ«¾ßÌåһЩ¡£ÔÚÃæ¶ÔÀ§ÄѺÍÎÊÌâµÄʱºò£¬»¹ÒªÓÂÓÚÃæ¶Ô£¬¸ÒÓÚÌôÕ½£¬²»¾øÁ¢ÒìÊÂÇé˼·£¬×ª±ä˼ά·½·¨£¬×¼È·Ñ°ÕÒÊÂÇéµÄÍ»ÆÆ¿Ú£¬ÇÐʵ°ì³ÉÊ¡¢°ìÍ×Ê¡£

,男人搞母犬在线观看免费,老熟女大屁股熟妇多毛,小姐姐手脚锁住放进水箱里¡£

??ʱÊÂ4£º芙宁娜被狂揉下面羞羞

??06ÔÂ01ÈÕ,金观平:推进新型城镇化和乡村全面振兴有机结合,

¿ªÑ§Ñ§Ð£Áìµ¼½²»° ƪ15

,ai换脸张婧仪狂❌,91女神高潮喷水在线观看,人体色情777777777¡£

??06ÔÂ01ÈÕ,中关村论坛年会期间将举办中关村国际前沿科技大赛总决赛,

¡¡¡¡×îºó, Ԥף±¾´Î´ó»áÔ²ÂúÀÖ³É!лл¸÷ÈË!

,4399成人黄A片,失禁+抹春药+哭喊+刺激视频,免费裸体美女㊙️网站¡£

Ôð±à£º王卫

ÉóºË£º张汉华

Ôð±à£º张师正

Ïà¹ØÍÆ¼ö »»Ò»»»

Copyright (C) 2001-   dzwww.com. All Rights Reserved

ÐÂÎÅÐÅϢЧÀÍÐí¿ÉÖ¤ - ÒôÏñÖÆÆ·³öÊéÐí¿ÉÖ¤ - ¹ã²¥µçÊÓ½ÚÄ¿ÖÆ×÷¾­ÓªÐí¿ÉÖ¤ - ÍøÂçÊÓÌýÐí¿ÉÖ¤ - ÍøÂçÎÄ»¯¾­ÓªÐí¿ÉÖ¤

ɽ¶«Ê¡»¥ÁªÍø´«Ã½¼¯ÍÅÖ÷°ì  ÁªÏµµç»°£º0531-85193202  Î¥·¨²»Á¼ÐÅÏ¢¾Ù±¨µç»°£º0531-85196540

³ICP±¸09023866ºÅ-1   ³¹«Íø°²±¸ 37010202000111ºÅ  

Copyright (C) 2001- Dzwww   ³ICP±¸09023866ºÅ-1

ÍøÕ¾µØÍ¼