久久99精品久久久野外观看,亚洲成人一区在线观看,岛国精品一区,99成人在线

首頁 > 新車測評 > 新車測評 > 保持對話繼續:使用ChatGPT修復337個bug中的162個,每個0.42美元

保持對話繼續:使用ChatGPT修復337個bug中的162個,每個0.42美元

發布時間:2024-05-28 16:40:11

引用

Xia C S, Zhang L. Keep the Conversation Going: Fixing 162 out of 337 bugs for $0.42 each using ChatGPT[J]. arXiv preprint arXiv:2304.00385, 2023.

論文:
https://arxiv.org/abs/2304.00385

摘要

自動程序修復(APR)旨在自動為有錯誤的程序生成補丁。傳統的 APR 技術缺乏補丁多樣性,因為它們嚴重依賴手工或挖掘的錯誤修復模式,并且不能輕易推廣到其他錯誤/修復類型。為了解決這一限制,最近的 APR 工作重點是利用現代大型語言模型 (LLM) 直接生成 APR 補丁。這種基于 LLM 的 APR 工具的工作原理是,首先構建使用原始錯誤代碼構建的輸入提示,然后查詢 LLM 以在錯誤位置填寫(完型式 APR)正確的代碼,或者生成一個全新的代碼片段作為修補。雖然基于 LLM 的 APR 工具能夠實現最先進的結果,但它仍然遵循經典的生成和驗證 (GV) 修復范例,即首先通過從相同的初始提示中采樣來生成大量補丁,然后驗證每個補丁之后的一個。這不僅會導致許多不正確的重復補丁,而且還會錯過測試失敗以及看似合理的補丁中的關鍵但之前被忽略的信息。為了解決上述限制,我們提出了 ChatRepair,這是第一個完全自動化的對話驅動的 APR 方法,它將補丁生成與即時反饋交織在一起,以對話方式執行 APR。 ChatRepair 首先向 LLM 提供相關測試失敗信息,然后從同一錯誤的早期修補嘗試的失敗和成功中學習,以獲得更強大的 APR。對于未能通過所有測試的早期補丁,我們將不正確的補丁與其相應的相關測試失敗信息結合起來,構建一個新的提示,供LLM生成下一個補丁。這樣,我們就可以避免犯同樣的錯誤。對于通過所有測試的早期補丁(即合理的補丁),我們進一步要求LLM生成原始合理補丁的替代變體。通過這種方式,我們可以進一步借鑒早期的成功經驗,生成更合理的補丁,從而增加獲得正確補丁的機會。雖然我們的方法是通用的,但我們使用最先進的基于對話的 LLM – ChatGPT 來實現 ChatRepair。我們對廣泛研究的 Defects4j 數據集的評估表明,ChatRepair 能夠在修復性能方面達到最先進的水平,在 Defects4j 1.2 和 2.0 上分別實現 114 和 48 個正確修復。通過計算訪問 ChatGPT 的成本,我們可以修復 337 個錯誤中的 162 個,每個錯誤 0.42 美元!

1 引言

自動程序修復 (APR) 是一種自動生成軟件錯誤補丁的有前途的方法。傳統的 APR 工具通常使用生成和驗證 (GV)范例,首先生成大量候選補丁,然后根據原始測試套件驗證每個補丁,以發現一組合理的補丁(通過所有測試)。然后將這些看似合理的補丁提供給開發人員,以找到正確修復潛在錯誤的正確補丁。傳統的APR技術可以分為基于模板的,基于啟發式的和基于約束的APR工具。在這些傳統技術中,基于模板的 APR 工具,使用手工制作或挖掘的修復模板來匹配和修復有缺陷的代碼模式,被認為是最先進的。然而,基于模板的工具缺乏補丁多樣性,因為它們無法輕松泛化到預定義模板列表之外的錯誤和模式。為了解決傳統 APR 技術的局限性,研究人員提出了利用深度學習進步的基于學習的 APR 方法。基于學習的方法主要基于神經機器翻譯(NMT)或大型語言模型(LLM)。基于 NMT 的 APR 工具將修復視為一項翻譯任務,通過使用歷史錯誤修復數據集訓練 NMT 模型將有錯誤的代碼轉換為正確的代碼。然而,這種基于 NMT 的 APR 工具嚴重依賴于其訓練數據,這些數據是通過抓取開源存儲庫來進行錯誤修復提交而獲得的。這意味著不僅訓練數據集可能有噪音(即包含不相關的提交/更改),而且這些基于 NMT 的方法可能無法推廣到在有限的訓練數據中未見的錯誤修復類型。

最近,研究人員開始直接利用高級LLM進行 APR。現代LLM接受了數十億個開源代碼片段的訓練,在許多與代碼相關的任務上展示了令人印象深刻的性能,并且可以學習在給定周圍上下文的情況下直接生成代碼(由于代碼自然性)。 AlphaRepair提出了第一個完形填空式(或填充式)APR 方法,其中有錯誤的代碼被刪除,并且 LLM 在給定前綴和后綴上下文的情況下直接預測正確的代碼。最近的工作還應用基于 LLM 的 APR 來自動完成單個正確行或生成完整的固定函數。一項更廣泛的研究研究了將更大的 LLM 和不同的 LLM 架構(即生成式和填充式)應用于 APR,并證明基于 LLM 的 APR 工具可以在許多 APR 任務上實現新的最先進的性能。同時,現有的基于LLM的APR渠道仍然存在以下局限性:

1)缺少測試失敗信息。當前基于 LLM 的工具沒有考慮原始 bug 暴露測試中的豐富信息。這些信息不僅可以幫助LLM理解被測源代碼的含義,還可以通過具體的代碼片段提供幫助和提示。圖 1 顯示了錯誤修復示例以及原始測試失敗信息。我們看到解決方法是將附加字符串交換為“\\000”。對于基于 LLM 的方法來說,這可能是一個極其困難的修復,因為這個獨特的字符串是這不是預訓練期間常用的字符串,并且當前函數上下文中也沒有其他三重字符串(“\\XXX”)的示例。然而,從測試中的失敗行和相應的錯誤消息中,我們看到測試期望輸出包含三個零,甚至包含直接在補丁中使用的代碼片段(“\\000”)!LLM在處理/利用測試失敗日志等非結構化/復雜信息方面表現出了強大的能力。如果不考慮它們,基于 LLM 的工具可能會浪費大量時間來生成不相關的補丁。

2)重復采樣。當前基于 LLM 的方法首先使用原始有缺陷的代碼構建輸入提示,然后要求 LLM 填寫正確的代碼(即完型填空式 APR)或生成全新的固定函數。使用初始提示,基于 LLM 的技術將對 LLM 進行多次采樣以生成許多補丁,類似于傳統的程序修復 GV 范例。然而,由于每個樣本都是完全獨立的,LLM 不知道任何先前生成的補丁。因此,基于 LLM 的工具可能會生成許多重復或類似的補丁,這些補丁已被確定為不正確,從而浪費 API 訪問的成本或 GPU 執行的時間。此外,這種重復采樣過程也與人類開發人員修復錯誤的方式截然不同,人類開發人員在知識的基礎上迭代構建,并嘗試從之前失敗的嘗試中提出下一個可能的補丁。

3)對有價值的合理補丁的無知。除了無法使用過去的錯誤補丁之外,當前基于 LLM 的 APR 工具也無法有效利用之前生成的合理補丁。合理的補丁已被證明是有價值的,因為它們通常與實際正確的補丁共享相似的位置。此外,我們進一步假設合理的補丁可能還包括通過所有測試的關鍵代碼成分,并且還可以幫助LLM更好地學習如何通過所有測試以生成更合理的補丁(從而增加生成正確補丁的機會)。通過忽略這些有價值的合理補丁信息并在生成合理補丁后從頭開始,現有的基于 LLM 的 APR 可能會錯過正確修復更多錯誤的機會。

我們的工作。我們推出 ChatRepair – 一種完全自動化的對話驅動的 APR 方法,它將補丁生成與即時反饋交織在一起,以對話方式執行補丁生成。雖然我們的想法很籠統,但為了構建 ChatRepair,我們使用最近開發的、當前最先進的基于對話的 LLM – ChatGPT,它不僅經過數十億代碼片段的訓練,而且還經過設計以對話方式使用,以更好地理解說明。 ChatRepair 首先提取相關測試失敗信息作為初始提示,為 ChatGPT 提供更多 APR 上下文信息。此外,ChatRepair 進一步從早期修補的失敗和成功中學習嘗試相同的錯誤以獲得更強大的 APR。對于未能通過所有測試的早期補丁,我們將不正確的補丁與其相應的測試失敗信息結合起來,構建一個新的提示,供 LLM 生成下一個補丁。這樣,我們就可以避免犯同樣的錯誤。對于通過所有測試的早期補丁(即合理的補丁),我們進一步要求LLM生成原始合理補丁的替代變體。通過這種方式,我們可以進一步借鑒早期的成功經驗,生成更合理的補丁,從而增加獲得正確補丁的機會。由于我們的方法使用 ChatGPT 模型,因此我們還計算用于修復錯誤的 ChatGPT API 查詢的美元成本。令人驚訝的是,我們發現通過使用 ChatRepair,我們可以修復 337 個錯誤中的 162 個,每個錯誤 0.42 美元。

本文做出以下貢獻:

維度。我們為全自動程序修復開辟了對話驅動范例的新維度。我們的工作首次證明,我們可以有效地利用以前被忽略的測試失敗信息,以及以對話方式進行的早期補丁嘗試,以提示LLM生成更正確的補丁。此外,我們展示了利用基于對話的LLM進行 APR 的廣闊前景。
技術。我們使用最新的ChatGPT 模型開發了ChatRepair,這是一種完全自動化的對話驅動的APR 工具。更具體地說,我們自動提取有關初始測試失敗以及早期補丁嘗試的簡潔相關信息,以提示 ChatGPT 進行有效的 APR。
評估。我們在廣泛研究的 Defects4j 1.2、2.0和 QuixBugs數據集上針對當前最先進的基于學習的傳統 APR 工具評估 ChatRepair。 ChatRepair 在 Defects4j 1.2 和 2.0 上分別獲得了 114 個和 48 個正確錯誤修復(比之前的最佳基線多 15 個和 17 個)的新的最先進修復結果。此外,我們進行了廣泛的消融研究,以證明利用豐富的語義測試失敗信息和 ChatRepair 的對話范例進行修復所獲得的改進。
2 技術介紹

我們提出了 ChatRepair,一種完全自動化的對話驅動的 APR 技術,它結合了多個維度的反饋信息來迭代查詢模型以生成補丁。 ChatRepair 不像現有基于 LLM 的 APR 技術那樣直接根據有缺陷的代碼生成補丁,而是另外提供有價值的測試失敗信息,以進一步幫助 LLM 生成補丁。此外,ChatRepair 并沒有像之前基于 LLM 的 APR 技術那樣從相同的提示中連續采樣,而是跟蹤對話歷史記錄,并通過提示從先前失敗和成功的同一錯誤修補嘗試中進一步學習。通過這種方式,ChatRepair 既可以避免以前的失敗,又可以在早期的成功(例如合理的補丁)的基礎上構建更有效的 APR。因此,ChatRepair 最大限度地提高了獲得正確修復潛在錯誤的真正正確補丁的能力。雖然我們的方法是通用的,可以使用不同的 LLM 并應用于各種不同的修復場景,但在這項工作中,我們使用專為對話交互設計的最先進的 ChatGPT 模型,如圖1所示。


圖1:ChatRepair整體工作流程

2.1 初始輸入

首先,我們使用原始的bug項目和bug來構建ChatGPT的初始提示,以啟動修復過程。我們遵循先前基于學習的APR工具,并主要關注線級修復(特別是填充或封閉型APR,因為它已被證明是最先進的[58])。同時,ChatRepair通常也可以用于各種不同的修復場景,我們將在后面的部分中更詳細地對其進行評估。

ChatRepair使用來自失敗測試的各種信息,包括1)它的名稱,2)觸發測試失敗的相關代碼行,以及3)產生的錯誤消息。失敗測試的名稱可以作為被測函數的簡短摘要。在圖2的例子中,失敗的測試是
testGreatestSubtypeUnionTypes5(),它告訴我們,我們正在測試一個與從聯合類型中確定最大子類型相關的功能。相關的測試代碼和錯誤消息給出了關于測試失敗原因的具體信息。在示例中,相關的測試代碼和錯誤消息告訴模型,我們正在比較No_OBJECT_TYPE,但源代碼函數錯誤地返回了一個None對象。這樣失敗的測試信息不僅在源代碼的功能方面為模型提供了更多的解釋,而且在預期輸出和函數使用方面提供了具體的信息,以幫助模型生成正確的修復。注意,如果有多個失敗的測試,ChatRepair只提供其中一個的信息,以保持簡潔的初始提示。最后,我們通過給model生成正確的行來替換填充位置的有bug的代碼來結束我們的初始提示。設C為輸出生成序列概率的ChatGPT,preandsufas為刪除錯誤行后的錯誤代碼的前綴和后綴,Ifillas為替換錯誤行的填充令牌,f0為構造的失敗測試信息,Ifillas為填充指令提示符。補丁pgenerated可以形式化的條件概率:C(p|pre,infill,suf,f0,Ifill)

據我們所知,ChatRepair是第一個通過結合故障信息的自然語言描述(例如,代碼在此測試中失敗:{failure_test})作為輸入到強大的ChatGPT模型中,以純提示方法應用這些測試失敗和錯誤消息的工作。與之前使用的修復測試執行信息不同[61],它依賴于自定義編碼或手工制作的啟發式,通過使用ChatGPT通過提示進行ChatRepair不僅是跨越不同編程語言但也不受測試信息類型的限制。

2.2 會話修補

我們首先使用創建的初始提示來查詢ChatGPT以獲得模型輸出并提取候選補丁。然后,我們轉移到方法的對話部分,我們將patch生成與測試驗證反饋交織在一起,以對話的方式提示未來的生成。每個由模型生成的補丁之后,都立即有一個補丁驗證步驟,以在測試套件上編譯和運行補丁。如果補丁未能通過測試,我們將使用不正確的補丁和失敗的測試構建詳細的反饋信息,作為下一個補丁生成提示的一部分。與初始提示類似,測試失敗信息可以幫助模型了解失敗原因,并為生成正確修復提供指導。在對話步驟中,我們進一步將測試失敗信息與之前不正確的補丁結合起來,不僅可以避免生成更多類似的不正確補丁,還可以從前幾代的錯誤中學習。我們重復這個過程,直到生成一個通過整個測試套件的可信補丁。

2.3 貌似合理的補丁生成

在前一步之后,ChatRepair應該獲得一個可以通過整個測試套件的貌似合理的補丁。然而,一個似是而非的補丁可能并不總是能夠正確地修復底層bug,因為測試套件可能是不完整的,因此無法覆蓋底層代碼的所有可能的預期用法。因此,開發人員必須手動檢查合理的補丁以確定正確的補丁。合理的補丁和最終正確的補丁都有一個相似的特點:它們都可以通過整個測試套件。因此,ChatRepair不是從頭開始),而是直接利用現有的可信補丁來創建更可信的補丁。簡而言之,為了增加我們能夠生成正確補丁的概率,ChatRepair采用之前生成的可信補丁,并要求模型生成替代變體并產生額外的候選補丁。

首先,我們采用最初使用的提示符,其中包含原始的有bug的代碼功能以及有用的測試失敗信息。然后,我們在提示符后面添加生成的合理補丁列表。在開始時,該列表將只包含上一步中單個合理的補丁,但是隨著我們繼續生成額外的合理補丁,它會增長。接下來,我們在提示符中指出我們想要解決的任務-請生成一個替代修復行。然后,我們使用這個提示符作為ChatGPT的輸入,并獲得一個候選補丁,我們將再次編譯并運行測試套件,以檢查它是否確實是另一個合理的補丁。我們不斷地查詢ChatGPT并更新提示符,以包含生成的新的可信補丁,以避免再次重復生成相同的可信補丁,并進一步構建早期的可信補丁。再次設C為輸出生成序列概率的ChatGPT模型,Ibe為初始提示符,Iplas為任務指令,PL<n={pl1,…,pln−1}是之前生成的可信補丁。生成的下一個似是而非的補丁可以形式化為條件概率:C(pli|I,PL<i,IPL)。

最后,我們得到一個似是而非的補丁列表,這些補丁可以交給開發人員進行人工檢查。與之前的APR工具(僅對原始錯誤代碼進行操作以生成補丁)不同,ChatRepair利用每個可能的補丁中額外的有用信息來獲得更多可能的補丁。一個合理的補丁通常包含有用的成分/模式,允許它通過原始測試套件;因此,ChatGPT不是從頭開始(即再次修復錯誤),而是在現有的可信補丁的基礎上構建,通過其強大的理解指令的能力,可以獲得額外的可信補丁,以增加我們的最終補丁列表中包含修復錯誤的正確補丁的可能性。

新車測評更多>>

民族畫報社一行來咸豐開展采風活動 奇瑞也要造皮卡了,三種動力版本,主打野性,25年上市 2025款領克03+正式上市,19.88萬起,還看什么GTI 定位潮趣智能GT轎車的海豹06 GT,如何吸引年輕人? 特斯拉Cybertruck不用國產了,長安幫你造了,19.99萬起 吉利銀河星艦7官圖發布,搭最新雷神超級電混技術 奧迪的電動高性能轎車要來了,超800匹馬力,還有旅行版 內行人奉勸大家,買手機首選華為,原因太真實 部分三星手機用戶反饋安裝11月更新后,無法使用安卓Auto功能 華為Nova13銷量不錯!和榮耀200系列相比哪個更香? 2025款寶馬3系實車到店,外觀辨識度高,車機系統升級,全系8AT 手握12萬,五菱星光S純電版和銀河E5,選誰更劃算? 比亞迪海豹06 GT到店,運動屬性加持,軸距2820mm,有望近期上市 10萬級插混SUV新選擇,藍電E5 PLUS上市,7.8秒可破百,值得買嗎? 國產純電超跑,售價168萬,2秒級破百,仰望U9有何硬實力? 解讀小鵬MONA M03,配雙英偉達芯片+高階智駕,不到16萬,不香? 比亞迪王朝首款中大型旗艦MPV亮相,預售30萬起,有顏值又有實力 全新海豹06GT來襲,預售15萬起,4.9秒可破百,能成爆款? 塊頭都不小呀!比亞迪騰勢N9、全新“夏”MPV現身目錄 蘋果推出新款iPad mini 現在即可訂購 10月23日在實體店開售 一汽紅旗:交付 EH7 榮耀版,助力體育強國 中國車企正在“顛覆”歐洲老牌制造商?小鵬、廣汽紛紛“安撫” 第100萬輛汽車下線 理想汽車成國內首個“百萬輛新勢力車企” AION V 打頭陣,廣汽開始籌謀歐洲市場 廣汽集團亮相巴黎車展,全新歐洲市場計劃推動全球化戰略 AI應用持續深化 打破游戲行業“不可能三角” 一線城市樓市:全面回暖,未來可期 政策大調整!樓市迎來巨變,官方態度明確,購房者需注意! 公認“低價高配”,4款16G+512G旗艦手機推薦,輕松流暢用五年 Counterpoint:2024年Q3全球智能手機市場同比增長2%,摩托羅拉和華為引領市場增長
久久99精品久久久野外观看,亚洲成人一区在线观看,岛国精品一区,99成人在线
亚洲va久久| 日韩精品一区二区三区免费观影| 激情久久99| 国产精品成人a在线观看| 欧美激情网址| 久久高清免费| 麻豆成人av在线| 亚洲欧美久久精品| 日韩欧美2区| 日韩欧美中文在线观看| 亚洲一区中文| 一区二区亚洲视频| 亚洲欧洲日本mm| 亚洲小说春色综合另类电影| 日韩一区二区三区免费视频| 国产探花一区在线观看| 久久wwww| 国产资源在线观看入口av| 午夜精品久久久久久久久久蜜桃| 久久久久国产| 日韩午夜高潮| 91福利精品在线观看| 国产日产高清欧美一区二区三区 | 久久精品亚洲一区二区| 国产96在线亚洲| 欧美va天堂在线| 国产精品毛片一区二区三区| 日韩av片子| 国产精品88久久久久久| 巨乳诱惑日韩免费av| 久久精品999| 高清一区二区| 99精品99| 麻豆一区二区三| 免费观看不卡av| 日本一不卡视频| 久久永久免费| 久久精品国产99久久| 亚洲一区二区av| 国产精品magnet| 久久免费大视频| 日韩专区欧美专区| 国产精品毛片久久久| 日韩大片在线播放| 蜜臀久久99精品久久久久宅男| 欧美亚洲专区| 日韩欧美自拍| 蜜桃一区二区三区在线| 精品一区视频| 亚洲免费网址| 精品美女视频| 久久最新视频| 久久只有精品| 久久午夜精品| 精品三区视频| 在线精品国产亚洲| 精品欧美视频| 久久国产成人| 欧美国产美女| 青青草伊人久久| 91精品国产乱码久久久久久久| 中文字幕一区二区av| sm久久捆绑调教精品一区| 视频一区二区中文字幕| 国产传媒在线观看| 日本在线一区二区三区| 亚洲a一区二区三区| 国产精品99久久免费观看| 免费视频国产一区| 欧美综合社区国产| 亚洲欧洲另类| 丝袜a∨在线一区二区三区不卡| 伊人久久av| 中文一区一区三区免费在线观 | 欧美不卡高清| 国产精品久久久久77777丨 | 欧美91精品| 精品一区二区三区在线观看视频| 国产精品美女久久久浪潮软件| 国产91在线精品| 综合亚洲色图| 五月天综合网站| 国产福利91精品一区二区| 亚洲三级视频| 不卡在线一区| 欧美aa一级| 久久精品一区二区三区中文字幕| 亚洲精品系列| 1000部精品久久久久久久久| 久久久久九九精品影院| 欧美在线亚洲| 国产一区二区三区四区五区| 91嫩草精品| 亚洲精品麻豆| 日韩精品一区第一页| 亚洲午夜久久久久久尤物| 精品一区二区三区四区五区| 天海翼亚洲一区二区三区| 欧美日韩一二| 日韩国产欧美| 国产精品99久久精品| 国产精品videossex| 日韩午夜视频在线| 亚洲最新av| 蜜桃91丨九色丨蝌蚪91桃色| 欧美日韩视频免费观看| 成人污污视频| 亚洲性视频h| 蜜桃久久久久久| 1024精品久久久久久久久| 精品欧美视频| 国产剧情一区二区在线观看| 免费在线观看视频一区| 在线综合亚洲| 在线国产一区二区| 五月天久久网站| 亚洲精品电影| 在线亚洲免费| 西西人体一区二区| 久久国产精品99国产| 成人在线网站| 日韩精品一区二区三区免费观看| 另类中文字幕国产精品| 日韩免费看片| 久久国产免费| 欧美亚洲国产激情| 亚洲经典在线| 亚洲精品乱码日韩| 欧美亚洲一级| 久久精品国产精品亚洲毛片| 精品三级av| 色综合www| 亚洲特级毛片| 国产精品日韩久久久| 男人的天堂亚洲一区| 中文字幕成人| 国产欧美在线| 国产精品成人一区二区不卡| 日韩精品欧美| 国产一区二区三区探花| 中文字幕系列一区| 丝袜美腿诱惑一区二区三区| 日韩欧美一区二区三区在线视频 | 97成人超碰| 狂野欧美性猛交xxxx| 麻豆mv在线观看| 亚洲精品a级片| 亚洲精品一级| 国产极品久久久久久久久波多结野| 欧美亚洲tv| 国产一区二区三区免费在线| 日韩久久精品| 免费黄网站欧美| 国产精品玖玖玖在线资源| 久久久久九九精品影院| 久久久国产精品一区二区中文| 视频在线观看91| 国产精品一区二区三区美女 | 美女久久精品| 久久婷婷一区| 在线观看亚洲精品福利片| 国产精品亚洲四区在线观看| 国产一区二区精品久| 五月天激情综合网| 91欧美极品| 日本欧美不卡| 最新国产精品视频| 老司机免费视频一区二区| 国产毛片久久| 四季av一区二区凹凸精品| 欧美国产日本| 999精品在线| 色8久久久久| 91国内精品| 日韩成人亚洲| 中文在线日韩| 麻豆成全视频免费观看在线看| 欧美午夜不卡| 国产精品日本一区二区三区在线| 色在线视频观看| 先锋影音国产一区| 精品深夜福利视频| 中文精品在线| 精品亚洲成人| 奶水喷射视频一区| 精品国产一区二| 视频一区在线播放| 手机在线电影一区| 蜜桃视频在线观看一区二区| 日韩成人精品一区| 亚洲综合小说| 欧美一区久久久| 日韩黄色在线观看| 蜜臀久久99精品久久一区二区| 国产精品乱战久久久| 伊人久久成人| 成人一二三区| 日韩va亚洲va欧美va久久| 午夜国产精品视频免费体验区| 蜜桃精品视频|