èÑÛÓ°Ï·
![]() |
ɽ¶«ÊÖ»ú±¨
èÑÛÓ°Ï·
¹«¹²Íø¹Ù·½Î¢ÐÅ
¹«¹²Íø¹Ù·½Î¢²©
¶¶Òô
ÈËÃñºÅ
È«¹úµ³Ã½Æ½Ì¨
ÑëÊÓÆµ
°Ù¼ÒºÅ
¿ìÊÖ
Í·ÌõºÅ
ßÙÁ¨ßÙÁ¨
èÑÛÓ°Ï·
和培智
ÊÖ»ú¼ì²ì
¡¡¡¡Ã¨ÑÛÓ°Ï·¼ÇÕß 兰燕飞 ±¨µÀw3u7903ejky2ywls
ÔÚÊý×Ö»¯Ê±´ú£¬ÊÓ¾õÐÅÏ¢ÔÚ֪ʶͨ±¨ºÍ¾ö²ßÖ§³ÖÖеÄÖØÒªÐÔÈÕÒæÍ¹ÏÔ¡£È»¶ø£¬¹Å°åµÄ¼ìË÷ÔöÇ¿ÐÍÉú³É£¨RAG£©ÒªÁìÔÚ´¦ÀíÊÓ¾õ¸»ºñÐÅÏ¢Ê±ÃæÁÙ×ÅÖî¶àÌôÕ½¡£Ò»·½Ã棬¹Å°åµÄ»ùÓÚÎı¾µÄÒªÁìÎÞ·¨´¦ÀíÊÓ¾õÏà¹ØÊý¾Ý£»ÁíÒ»·½Ã棬ÏÖÓеÄÊÓ¾õ RAG ÒªÁìÊÜÏÞÓÚ½ç˵µÄÀιÌÁ÷³Ì£¬ÄÑÒÔÓÐЧ¼¤»îÄ£Ð͵ÄÍÆÀíÄÜÁ¦¡£
À´×Ô°¢Àï°Í°ÍͨÒåʵÑéÊÒµÄ×îÐÂÑо¿½á¹û ¡ª¡ªVRAG-RL£¨Empower Vision-Perception-Based RAG for Visually Rich Information Understanding via Iterative Reasoning with Reinforcement Learning£©£¬½«Ç¿»¯Ñ§Ï°Ëã·¨ÒýÈë¶àģ̬ÖÇÄÜÌåѵÁ·£¬½èÖúµü´úÍÆÀíºÍÊÓ¾õ¸ÐÖª¿Õ¼ä£¬È«·½Î»ÌáÉýÊÓ¾õÓïÑÔÄ£ÐÍ£¨VLMs£©ÔÚ¼ìË÷¡¢ÍÆÀíºÍÀí½âÊÓ¾õÐÅÏ¢·½ÃæµÄÄÜÁ¦£¬Îª´¿ÊÓ¾õ¼ìË÷ÔöÇ¿Éú³ÉÈÎÎñÌṩÓÐЧ½â¾ö¼Æ»®£¬´úÂ롢ģÐÍÈ«Ãæ¿ªÔ´£¡
Paper µØµã£ºarxiv.org/pdf/2505.22019Github µØµã£ºhttps://github.com/Alibaba-NLP/VRAG
ΪÁ˽â¾öÏÖÓÐ RAG ÒªÁìÔÚ´¦ÀíÊÓ¾õ¸»ºñÎĵµÊ±ÃæÁÙµÄÌôÕ½£¬ÓÈÆäÊÇÉú³É½×¶ÎÍÆÀíÄÜÁ¦È±·¦µÄÎÊÌ⣬ÎÒÃÇÍÆ³öÁË VRAG-RL£¬¸Ã¿ò¼ÜÒýÈëÇ¿»¯Ñ§Ï°£¬×¨ÎªÊÓ¾õ¸»ºñÐÅÏ¢ÅÓ´óÍÆÀíÁ¿Éí¶¨ÖÆ¡£VRAG-RL ͨ¹ý½ç˵ÊÓ¾õ¸ÐÖªÐж¯¿Õ¼ä£¬Ê¹Ä£ÐÍÄܹ»´Ó´Öµ½Ï¸µØÖð²½¾Û½¹ÐÅÏ¢Ãܼ¯ÇøÓò£¬¾«×¼ÌáȡҪº¦ÊÓ¾õÐÅÏ¢£¬´Ó¶øÈ«·½Î»ÌáÉýÊÓ¾õÓïÑÔÄ£ÐÍ£¨VLMs£©ÔÚ¼ìË÷¡¢ÍÆÀíºÍÀí½âÊÓ¾õÐÅÏ¢·½ÃæµÄÄÜÁ¦¡£
Óë´Ëͬʱ£¬ÎÒÃÇ×¢Òâµ½ÏÖÓеÄÒªÁìÔÚ½«Óû§ÅÌÎÊת»¯ÎªËÑË÷ÒýÇæ¿ÉÀí½âµÄ¼ìË÷ÇëÇóʱ£¬¾³£ÒòÎÞ·¨¾«×¼±í´ïÐèÇó¶øÄÑÒÔ¼ìË÷µ½Ïà¹ØÐÅÏ¢£¬ÍùÍù±£´æÓïÒ寫²î»òÐÅϢȱʧµÄÎÊÌâ¡£Õâ²»µ«Ó°ÏìÁ˼ìË÷½á¹ûµÄÏà¹ØÐÔ£¬»¹ÏÞÖÆÁËÄ£ÐÍÔÚºóÐøÉú³É½×¶ÎµÄÍÆÀíÄÜÁ¦¡£ÎªÁ˽â¾öÕâÒ»ÎÊÌ⣬VRAG-RL ÒýÈëÁËÒ»ÖÖÁ¢ÒìµÄ¼ìË÷»úÖÆ£¬Í¨¹ý½áºÏÊÓ¾õ¸ÐÖªÐж¯ºÍÇ¿»¯Ñ§Ï°£¬Ê¹Ä£ÐÍÄܹ»¸üÓÐЧµØÓëËÑË÷ÒýÇæ½øÐн»»¥¡£ÕâÖÖ»úÖÆ²»µ«Äܹ»×ÊÖúÄ£Ð͸ü¾«×¼µØ±í´ï¼ìË÷ÐèÇ󣬻¹Äܹ»ÔÚ¼ìË÷Àú³ÌÖж¯Ì¬µ÷½â¼ìË÷Õ½ÂÔ£¬´Ó¶øÏÔÖøÌáÉý¼ìË÷ЧÂʺͽá¹ûµÄÏà¹ØÐÔ¡£
ÖØ½ç˵¸ÐÖªÐж¯¿Õ¼ä
ÊÓ¾õ·ÂÉú˼¿¼Ð·¶Ê½
¹Å°å RAG ÒªÁìÔÚ´¦ÀíÊÓ¾õÐÅϢʱ£¬ÍùÍù½ÓÄÉÀι̵ļìË÷ - Éú³ÉÁ÷³Ì£¬¼´ÏÈͨ¹ýËÑË÷ÒýÇæ¼ìË÷Ïà¹ØÐÅÏ¢£¬È»ºóÖ±½ÓÉú³ÉÃյס£ÕâÖÖÀιÌÁ÷³ÌºöÂÔÁËÊÓ¾õÐÅÏ¢µÄÆæÌØÐÔ£¬ÎÞ·¨³ä·ÖÀûÓÃÊÓ¾õÊý¾ÝÖеĸ»ºñϸ½Ú£¬µ¼ÖÂÍÆÀíÄÜÁ¦ÊÜÏÞ¡£
Ïà±È֮ϣ¬VRAG-RL ³¹µ×¸ïÐÂÁ˹ŰåµÄ¼ìË÷Éú³É·¶Ê½£¬ÒýÈëÁ˶àÑù»¯µÄÊÓ¾õ¸ÐÖªÐж¯£¬ÆäÖаüÀ¨Á˶àÖÖÊÓ¾õ¸ÐÖªÐж¯£¬ÈçÇøÓòÑ¡Ôñ¡¢²Ã¼ô¡¢Ëõ·ÅµÈ¡£ÕâЩÐж¯Ê¹ VLMs Äܹ»´Ó´ÖÁ£¶Èµ½Ï¸Á£¶ÈÖð²½¾Û½¹ÐÅÏ¢Ãܼ¯ÇøÓò£¬¾«×¼ÌáȡҪº¦ÊÓ¾õÐÅÏ¢¡£ÀýÈ磬ÔÚ´¦ÀíÅÓ´óµÄͼ±í»ò½á¹¹Ê±£¬Ä£ÐÍ¿ÉÒÔÏÈ´ÓÕûÌåͼÏñÖÐÌáÈ¡´óÖÂÐÅÏ¢£¬È»ºóÖð²½¾Û½¹µ½ÐÅÏ¢Ãܼ¯µÄÇøÓò£¬Í¨¹ý²Ã¼ôºÍËõ·Å²Ù×÷£¬»ñÈ¡¸üÇåÎú¡¢¸üÏêϸµÄÊÓ¾õÐÅÏ¢¡£ÕâÖÖ´Ó´ÖÁ£¶Èµ½Ï¸Á£¶ÈµÄ¸ÐÖª·½·¨£¬²»µ«Ìá¸ßÁËÄ£ÐͶÔÊÓ¾õÐÅÏ¢µÄÀí½âÄÜÁ¦£¬»¹ÏÔÖøÌáÉýÁ˼ìË÷ЧÂÊ£¬Ê¹Ä£ÐÍÄܹ»¸ü¿ìËٵض¨Î»µ½ÓëÎÊÌâÏà¹ØµÄͼÏñÄÚÈÝ¡£
VRAG-RL ½ÓÄÉÁ˶àר¼Ò²ÉÑùÕ½ÂÔ¹¹½¨ÑµÁ·Êý¾Ý£¬´ó¹æÄ£Ä£ÐÍÂôÁ¦È·¶¨ÕûÌåµÄÍÆÀí·¾¶£¬¶ø×¨¼ÒÄ£ÐÍÔòÔÚ´ó¹æÄ£Ä£Ð͵ÄÖ¸µ¼Ï£¬¶ÔͼÏñÖеÄÒªº¦ÇøÓò½øÐо«È·±ê×¢£¬½áºÏ´ó¹æÄ£Ä£Ð͵ÄÍÆÀíÄÜÁ¦ºÍר¼ÒÄ£Ð͵ľ«È·±ê×¢ÄÜÁ¦£¬Ä£ÐÍÄܹ»ÔÚѵÁ·Àú³ÌÖÐѧϰµ½¸üÓÐЧµÄÊÓ¾õ¸ÐÖªÕ½ÂÔ£¬ÏÔÖøÌáÉýÁËÄ£ÐÍÔÚʵ¼ÊÓ¦ÓÃÖеÄÌåÏÖ¡£
¼ìË÷ÓëÍÆÀíÐͬÓÅ»¯
ЧÂÊÓëÉî¶ÈË«ÖØÌáÉý
VRAG-RL µÄϸÁ£¶È½±Àø»úÖÆ½«¼ìË÷ЧÂÊ¡¢Ä£Ê½Ò»ÖÂÐÔÓëÉú³ÉÖÊÁ¿Èý·½ÃæÒòËØÈںϣ¬Òýµ¼Ä£ÐÍÔÚÓëËÑË÷ÒýÇæµÄ½»»¥Öв»¾øÓÅ»¯Æä¼ìË÷ÓëÍÆÀí·¾¶¡£
¼ìË÷ЧÂʽ±Àø £º½è¼øÐÅÏ¢¼ìË÷ÁìÓò¹ã·ºÊ¹ÓÃµÄ NDCG£¨Normalized Discounted Cumulative Gain£©Ö¸±ê£¬¼¤ÀøÄ£ÐÍÓÅÏȼìË÷Ïà¹Ø¶È¸ßµÄͼÏñÄÚÈÝ£¬¿ìËÙ¹¹½¨¸ßÖÊÁ¿ÉÏÏÂÎÄ£»Ä£Ê½Ò»ÖÂÐÔ½±Àø £ºÈ·±£Ä£ÐÍ×ñÑÔ¤ÉèµÄÍÆÀíÂ߼·¾¶£¬ÖÆÖ¹Òòģʽƫ²îµ¼ÖÂÉú³É½á¹ûÆ«ÀëÈÎÎñÄ¿±ê£»Éú³ÉÖÊÁ¿½±Àø £ºÍ¨¹ýÆÀ¹ÀÄ£ÐͶÔÉú³ÉÃÕµ×µÄÖÊÁ¿´ò·Ö£¬Òýµ¼Ä£ÐÍÊä³ö¸ü׼ȷ¡¢Á¬¹áµÄÃյס£
ÕâÖÖ¶àά¶È½±Àø»úÖÆÊµÏÖÁ˼ìË÷ÓëÍÆÀíµÄË«ÏòÇý¶¯¡ª¡ª¸ßЧµÄ¼ìË÷ΪÉîÈëÍÆÀíÌṩ֧³Å£¬¶øÍÆÀí·´ÏìÓÖ½øÒ»²½Ö¸µ¼Ä£ÐÍÓÅ»¯¼ìË÷Õ½ÂÔ£¬Ðγɱջ·ÓÅ»¯¡£
Ç¿»¯Ñ§Ï°¸³Äܶàģ̬ÖÇÄÜÌåѵÁ·
VRAG-RL »ùÓÚÇ¿»¯Ñ§Ï°µÄѵÁ·Õ½ÂÔ£¬ÒýÈëÒµ½çÁìÏ鵀 GRPO Ëã·¨£¬ÈÃÊÓ¾õÓïÑÔÄ£ÐÍ£¨VLMs£©ÔÚÓëËÑË÷ÒýÇæµÄ¶àÂÖ½»»¥ÖУ¬Á¬ÐøÓÅ»¯¼ìË÷ÓëÍÆÀíÄÜÁ¦¡£Í¬Ê±£¬Í¨¹ýÍâµØ°²ÅÅËÑË÷ÒýÇæÄ£ÄâÕæÊµÊÀ½çÓ¦Óó¡¾°£¬ÊµÏÖËÑË÷ÒýÇæÅ²ÓÃÁ㱾Ǯ£¬Ä£ÐÍѵÁ·Ô½·¢¸ßЧ¡£ÕâÖÖѵÁ··½·¨£¬²»µ«ÌáÉýÁËÄ£Ð͵ķº»¯ÄÜÁ¦£¬Ê¹ÆäÔÚ²î±ðÁìÓò¡¢²î±ðÀàÐ͵ÄÊÓ¾õÈÎÎñÖж¼ÄÜÌåÏÖ¾«²Ê£¬Îª¶àģ̬ÖÇÄÜÌåµÄѵÁ·ÌṩȫеĽâ¾ö¼Æ»®¡£
ʵÑéÆÊÎö
VRAG-RL ÔÚ¸÷¸ö»ù×¼Êý¾Ý¼¯ÉϾùÈ¡µÃÁËÏÔÖøÓÅÓÚÏÖÓÐÒªÁìµÄÐÔÄÜ£¬º¸ÇÁË´Óµ¥Ìøµ½¶àÌøÍÆÀí¡¢´ÓÎı¾µ½Í¼±íºÍ½á¹¹µÈ¶àÖÖÅÓ´óµÄÊÓ¾õºÍÓïÑÔÈÎÎñÀàÐÍ¡£ÊµÑé½á¹û±êÃ÷£¬VRAG-RL ÔÚ´¦ÀíÊÓ¾õ¸»ºñÐÅϢʱ¾ßÓÐÏÔÖøµÄÓÅÊÆ£¬Äܹ»¸üÓÐЧµØ½øÐмìË÷¡¢ÍÆÀíºÍÉú³É¸ßÖÊÁ¿µÄÃյס£ÎÞÂÛÊÇÔڹŰåµÄ prompt-based ÒªÁ죨Èç Vanilla RAG ºÍ ReAct RAG£©ÕÕ¾ÉÔÚ»ùÓÚÇ¿»¯Ñ§Ï°µÄÒªÁ죨Èç Search-R1£©ÉÏ£¬VRAG-RL ¶¼Õ¹ÏÖ³öÁËÏÔÖøµÄÐÔÄÜÌáÉý¡£
ÔڹŰåµÄ RAG ÒªÁìÖУ¬Ä£ÐÍͨ³£ÔÚ½øÐÐÒ»´Î»ò¶à´Î¼ìË÷ºóÖ±½ÓÉú³ÉÃյס£È»¶ø£¬ÔÚ´¦ÀíÅÓ´óµÄÊÓ¾õÈÎÎñʱ£¬ÕâÖÖÒªÁìÍùÍùÌåÏÖ²»¼Ñ£¬ÒòΪËüȱ·¦¶ÔÊÓ¾õÐÅÏ¢µÄÉîÈëÀí½âºÍ¶àÂÖÍÆÀíÄÜÁ¦¡£
Ïà±È֮ϣ¬ÎÒÃÇµÄ VRAG-RL ÒªÁìÖ§³Ö¶àÂÖ½»»¥¡£¾ßÌåÀ´Ëµ£¬Í¨¹ý½ç˵ÊÓ¾õ¸ÐÖªÐж¯¿Õ¼ä£¬VRAG-RL Äܹ»ÔÚÍÆÀí½×¶ÎÖð²½¾Û½¹ÓÚÐÅÏ¢Ãܼ¯ÇøÓò£¬´Ó¶øÊµÏÖ´Ó´Öµ½Ï¸µÄÐÅÏ¢»ñÈ¡¡£Í¬Ê±£¬¸ÃÒªÁìͨ¹ýÓÅ»¯¼ìË÷ЧÂʺÍÍÆÀí·¾¶£¬ÔÚ¼á³Ö¸ßЧÂʵÄͬʱ£¬ÏÔÖøÌáÉýÁËÄ£ÐÍÔÚÊÓ¾õÈÎÎñÉϵÄÐÔÄÜ¡£
δÀ´Õ¹Íû
¿ªÆôÊÓ¾õ¸ÐÖªÇý¶¯¶àÄ£Ì¬ÍÆÀíµÄÐÂʱ´ú
VRAG-RL ΪÊÓ¾õ¸»ºñÐÅÏ¢µÄ¼ìË÷ÔöÇ¿Éú³ÉÈÎÎñ¿ª±ÙÁËеÄÃÅ·¡£Î´À´£¬Ñо¿ÍŶӼƻ®½øÒ»²½ÍØÕ¹Ä£Ð͵ÄÄÜÁ¦£¬ÒýÈë¸ü¶àÄ£·ÂÈËÀà´¦ÀíÅÓ´óÐÅÏ¢µÄÐж¯£¬Ê¹Ä£ÐÍÄܹ»¸üÉîÈëµØ½øÐÐ˼¿¼¡£Í¬Ê±£¬ÍŶӻ¹½«ÖÂÁ¦ÓÚ¼õÉÙÄ£Ð͵ĻþõÏÖÏó£¬Í¨¹ýÒýÈë¸üÏȽøµÄÄ£Ðͼܹ¹ºÍѵÁ·ÒªÁ죬½øÒ»²½Ìá¸ß¿ò¼ÜµÄ׼ȷÐԺͿɿ¿ÐÔ£¬Íƶ¯ÊÓ¾õÓïÑÔÄ£ÐÍÔÚ¸ü¶àʵ¼ÊÓ¦Óó¡¾°ÖеÄÂ䵨ÓëÉú³¤¡£
??ʱÊÂ1£º掀起女班长的裙子打光屁股
??06ÔÂ06ÈÕ,刚果(金)一船只倾覆致5死 35人仍失踪,
¡¡¡¡ÖÚÈËÏŵ½ÂúÉí·¢Á¹£¬ÕâÖêÁøÄ¾Ì«ÑýаÁË£¬²»¿ÉÒÔ³£Àí¶ÈÖ®£¬Ëĸ»¼ÒÕâÑùÁªÊÖ¹¥»÷Ëü£¬ÏëÀ´½«»áÊÇÒ»´Î×î´óµÄʧËã¡£
,新玥tv5¡£??06ÔÂ06ÈÕ,打通金融服务农村“最后一公里”,
¡¡¡¡4¡¢Ñ§»á¸ïÐÂѧϰҪÁì
,俺たちのゲームセット百度翻译,动漫裸体㊙️免费看网站视频,桃花岛成年入口进入thd688¡£??ʱÊÂ2£º我扒妺妺内裤扒下光屁股
??06ÔÂ06ÈÕ,“五一”假期:音乐人唱响美好旋律 观众享近郊旅游好时光,
¡¡¡¡¶þ¡¢Ñ§Ð£ÃæÁÙµÄÐÎÊÆºÍ±£´æÎÊÌ⣺
,大乳美女大乳,美女被❌❌吸乳得到大胸,魅影直播5.3最新版特色¡£??06ÔÂ06ÈÕ,广厦男篮胜天津男篮 孙铭徽升至CBA历史助攻榜第七,
¡¡¡¡¡°ºä¡¡£¡¡±
,想要叉叉百度网盘,欧美18🈲️色情福利小视频,美女扒开㊙️部位让男人桶¡£??ʱÊÂ3£º利用时间静止狂C美女
??06ÔÂ06ÈÕ,《群书治要续编》出版座谈会在北京举行,
¡¡¡¡¡°´óÉô£¬ÕæÀ÷º¦£¡¡±Ð¡²»µã¾ªÌ¾¡£
,火影纲手❌❌❌污污,小仙女自慰www蹭蹭蹭av,顶级欧美熟妇XXOOHD艳星¡£??06ÔÂ06ÈÕ,湖南张家界上演峰林杂技秀,
¡¡¡¡¡°ÎÒÃÇÕâÊǵ½ÁËÄÄÀ¾àÀëÏç´å´ó¶¼ÓÐÁùÆß°ÙÀïÁ˰ɡ£ß×£¬É½ÄDZßÓд¶ÑÌ¡£¡±¶þÃÍÖ¸Ïòǰ·½¡£
,把放进里www网站,办公室乳舔孕妇,美女扒开㊙️部位让男人打¡£??ʱÊÂ4£º白丝爆❌jk漫画网站免费
??06ÔÂ06ÈÕ,183家非银行支付机构将迎新规 实施细则征求意见了,
¡¡¡¡1¡¢ÔöÇ¿ÐÅÏ¢»¯È˲ލÉ裬Î÷Ö±½ÖСѧ±»¶¨Îª½ÌÓýÐÅÏ¢»¯ÅàѵѧУ¡£½ÌʦÅàѵ·½·¨£º×ß³öÈ¥£¬Çë½øÀ´¡£
,玖辛奈强乳喷自慰爽,搡我娇小嫩苞又嫩又紧小说,麻豆黄漫❌18禁动漫原神¡£??06ÔÂ06ÈÕ,徐工澳洲研发中心,揭牌成立,
¡¡¡¡¡°Ð»Ð»º£Ò¯£¬º£Ê壬ÄãÃÇ¿ì×ß°É£¬À뿪Õâ¸öÏç´å£¬Î÷½®½«Òª±¬·¢´óµØ¶¯ÁË¡£¡±Ð¡²»µã˵µÀ¡£
,韩漫被❌到爽🔞流视频,91精品秘无码网站,菠萝蜜成人🔞在线¡£Ôð±à£º方荣
ÉóºË£º张永文
Ôð±à£º侯赛尼耶
Copyright (C) 2001- dzwww.com. All Rights Reserved
ÐÂÎÅÐÅϢЧÀÍÐí¿ÉÖ¤ - ÒôÏñÖÆÆ·³öÊéÐí¿ÉÖ¤ - ¹ã²¥µçÊÓ½ÚÄ¿ÖÆ×÷¾ÓªÐí¿ÉÖ¤ - ÍøÂçÊÓÌýÐí¿ÉÖ¤ - ÍøÂçÎÄ»¯¾ÓªÐí¿ÉÖ¤
ɽ¶«Ê¡»¥ÁªÍø´«Ã½¼¯ÍÅÖ÷°ì ÁªÏµµç»°£º0531-85193202 Î¥·¨²»Á¼ÐÅÏ¢¾Ù±¨µç»°£º0531-85196540
Copyright (C) 2001- Dzwww ³ICP±¸09023866ºÅ-1