ChatGPT กับ Bing Chat AI: ไหนดีกว่ากัน?

เผยแพร่แล้ว: 2023-04-12

โลโก้ ChatGPT และ Bing

ChatGPT และ Bing Chat เป็นแชทบอทที่ได้รับความนิยมสูงสุด 2 ตัวในขณะนี้ และทั้งคู่ขับเคลื่อนโดยโมเดลภาษาขนาดใหญ่ (LLM) ที่สร้างโดย OpenAI ที่คล้ายกัน แต่อันไหนดีกว่าที่จะใช้จริง ๆ ?

ChatGPT และ Bing Chat AI ต่างใช้โมเดลภาษา GPT ที่พัฒนาโดย OpenAI แต่ใช้งานคนละเวอร์ชัน และมีวิธีจัดการอินพุตต่างกัน ในเดือนเมษายน 2023 Bing ใช้รุ่นทดสอบของรุ่น GPT-4 ในขณะที่ ChatGPT ใช้รุ่น GPT 3.5-turbo ที่เก่ากว่า แชทบอททั้งสองมีการปรับแต่งตามรูปแบบภาษา เช่น วิธีการป้อนข้อมูลและคุณลักษณะอินเทอร์เฟซที่แตกต่างกัน และ Bing มีการผสานรวมกับแอปพลิเคชันอย่าง Edge และ Skype โดยเฉพาะ

หมายเหตุ: ทั้ง ChatGPT และ Bing Chat ต่างก็มีการเปลี่ยนแปลงอย่างรวดเร็ว และทั้ง Chatbot ต่างก็ให้คำตอบที่เหมือนกันทุกประการสำหรับข้อความแจ้งที่ได้รับในแต่ละครั้ง ผลลัพธ์ของคุณอาจแตกต่างกันไปตามคำแนะนำที่ใช้ที่นี่

การใช้งานและการเข้าถึง

Bing Chat และ ChatGPT มีให้บริการสำหรับทุกคนที่ลงทะเบียนด้วยบัญชี แม้ว่า Bing จะให้คุณเข้าร่วม "รายชื่อผู้รอ" ก่อน ซึ่งจะให้สิทธิ์เข้าถึงทันที แชทบอททั้งสองมีเวอร์ชันสำหรับเว็บ ยกเว้นไซต์ของ Bing จะบล็อกทุกเบราว์เซอร์ยกเว้น Microsoft Edge โดยไม่มีวิธีแก้ปัญหา คุณสามารถใช้ Bing Chat กับบัญชี Microsoft ได้ที่ bing.com/new และเรามีคำอธิบายวิธีใช้ ChatGPT

ถาม Bing ถึงสีโปรด
Bing Chat บนเว็บ

Bing ยังรวมเข้ากับแอปและบริการอื่นๆ ของ Microsoft เช่น แถบด้านข้างใน Microsoft Edge, แชทบอทใน Skype และแอป Bing สำหรับอุปกรณ์เคลื่อนที่ ChatGPT ไม่มีแอปบนอุปกรณ์เคลื่อนที่อย่างเป็นทางการ แต่คุณสามารถใช้เว็บแอปบนโทรศัพท์หรือแท็บเล็ตได้ อย่างไรก็ตาม Microsoft ได้ช้ากว่าในการเพิ่มคุณสมบัติจากอินเทอร์เฟซเว็บไปยังแถบด้านข้าง Edge, Skype chatbot และอินเทอร์เฟซอื่นๆ หากคุณต้องการคุณสมบัติทั้งหมดของ Bing Chat คุณควรยึดติดกับไซต์ Bing อย่างน้อยก็ในตอนนี้

ถาม ChatGPT เกี่ยวกับสีโปรด
ChatGPT

เว็บอินเทอร์เฟซสำหรับ ChatGPT และ Bing Chat มีความคล้ายคลึงกัน แต่มีความแตกต่างเล็กน้อยที่เปลี่ยนประโยชน์การใช้งาน ChatGPT ได้รับการออกแบบมาให้รับข้อมูลได้มากขึ้น เช่น บล็อกโค้ดที่ยาวขึ้นหรือตัวอย่างโค้ดขนาดใหญ่ ในเดือนเมษายน 2023 Bing จะจำกัดไว้ที่ 2,000 อักขระ ในขณะที่ขีดจำกัดของ ChatGPT นั้นสูงกว่ามาก (และไม่ได้ระบุอย่างเป็นทางการ)

ความถูกต้องตามข้อเท็จจริง

ChatGPT ไม่มีความสามารถในการจัดทำดัชนีเว็บแบบเรียลไทม์สำหรับข้อมูล แม้ว่าในที่สุดจะสามารถทำได้ด้วยการใช้ปลั๊กอิน จำกัดไว้เฉพาะข้อมูลการฝึกอบรมในโมเดลซึ่งย้อนหลังไปถึงเดือนกันยายน 2021 นอกจากนี้ OpenAI ยังไม่ต้องการแชร์วิธีการรวบรวมข้อมูลหรือวิธีทดสอบความถูกต้อง และอื่นๆ Bing ยังใช้เทคโนโลยี GPT เดียวกัน แต่มักจะชอบผลลัพธ์จากเว็บมากกว่าข้อมูลการฝึกอบรม

Bing Chat และ ChatGPT มักจะถูกต้องเมื่อพูดถึงข้อเท็จจริงพื้นฐาน เช่น เมืองหลวงของประเทศหรือรัฐ เมื่อเกิดบุคคลที่มีชื่อเสียง และอื่นๆ ตัวอย่างเช่น Bing และ ChatGPT สามารถบอกฉันได้อย่างถูกต้องว่าเมืองหลวงของสหราชอาณาจักรคืออะไร (ลอนดอน) มีดาวกี่ดวงบนธงชาติสหรัฐอเมริกา (50 ดวง) และสุนัขมีกี่ขา (สี่) . ถ้ามันง่าย บอททั้งสองน่าจะใช่… แต่เครื่องมือค้นหาทั่วไปก็เช่นกัน คุณเริ่มมีปัญหาเมื่อการตอบคำถามเกี่ยวข้องกับการตีความในระดับหนึ่ง

ChatGPT ตอบเมืองหลวงของสหราชอาณาจักรและจำนวนดาวบนธงชาติสหรัฐฯ

ตัวอย่างเช่น ฉันพยายามถามบอททั้งสองว่า “เมืองหลวงของรัฐใดในสหรัฐอเมริกาที่ขึ้นต้นด้วยตัวอักษร A” ดูเหมือนง่าย แต่ก็ยังมีกระบวนการหลายขั้นตอน ก่อนอื่นคุณต้องมีรายชื่อเมืองหลวงทั้งหมด จากนั้นคุณต้องกรองให้เหลือเฉพาะเมืองหลวงที่ขึ้นต้นด้วยตัวอักษร A วิกิพีเดียนับทั้งหมดห้าแห่ง: Albany, Annapolis, Atlanta ออกัสตาและออสติน Bing Chat ตอบคำถามได้ถูกต้อง โดยอ้างอิงหน้าเว็บหลายหน้าที่แสดงรายการเมืองหลวงในสหรัฐอเมริกา ChatGPT… มีปัญหาบางอย่าง

อย่างแรก ChatGPT ให้รายชื่อเมืองหลวงสี่แห่งแก่ฉัน ได้แก่ ออลบานี แอนนาโพลิส แอตแลนตา และออกัสตา หลังจากนั้นก็มีข้อความว่า “มีออสตินด้วย ซึ่งเป็นเมืองหลวงของรัฐเท็กซัส แต่มันไม่ได้ขึ้นต้นด้วยตัวอักษร A” การถามคำถามเดิมซ้ำๆ กันหลายๆ ครั้งบางครั้งก็ไม่ได้พูดถึงออสตินเลย การถามว่าทำไม Austin ถึงหายไป ทำให้ ChatGPT จำได้ว่ามี Austin อยู่และขออภัยสำหรับข้อผิดพลาด แต่ก็ไม่ชัดเจนว่าเหตุใดจึงล่มกับคำตอบเริ่มต้น

Bing: เมืองหลวงของรัฐในสหรัฐอเมริกาที่ขึ้นต้นด้วยตัวอักษร A ได้แก่ Albany (New York), Annapolis (Maryland), Atlanta (Georgia), Augusta (Maine) และ Austin (Texas)

ChatGPT: มีสี่เมืองหลวงของรัฐในสหรัฐอเมริกาที่ขึ้นต้นด้วยตัวอักษร "A": 1. ออลบานี - เมืองหลวงของนิวยอร์ก 2. แอนนาโพลิส - เมืองหลวงของรัฐแมรี่แลนด์ 3. แอตแลนตา - เมืองหลวงของจอร์เจีย 4. ออกัสตา - เมืองหลวงของรัฐเมน หมายเหตุ : มีออสตินซึ่งเป็นเมืองหลวงของรัฐเท็กซัสด้วย แต่ไม่ได้ขึ้นต้นด้วยตัวอักษร "A"

ฉันได้ลองใช้คำถามอื่นที่แชทบอททั้งสองควรจะสามารถตอบได้อย่างถูกต้อง แม้ว่าจะใช้ข้อมูลที่เก่ากว่าของ ChatGPT ก็ตาม: "สามประเทศใดที่เข้าร่วมในสหภาพยุโรปล่าสุด" Wikipedia อธิบายว่าโครเอเชียเป็นชาติสมาชิกล่าสุดที่เข้าร่วมเมื่อวันที่ 1 กรกฎาคม 2013 โดยมีบัลแกเรียและโรมาเนียเข้าร่วมก่อนหน้านั้นในวันเดียวกัน: 1 มกราคม 2007

ChatGPT ทำให้คำถามนี้ถูกต้อง รวมถึงลำดับของประเทศและวันที่ Bing ระบุอย่างถูกต้องว่าโครเอเชียเป็นประเทศสมาชิกล่าสุด แต่ระบุสโลวีเนียและมอลตาเป็นอีกสองประเทศ ทั้งสโลวีเนียและมอลตาเข้าร่วมเมื่อวันที่ 1 พฤษภาคม พ.ศ. 2547 พร้อมกันกับอีก 8 ประเทศ แต่ก่อนหน้านั้นบัลแกเรียและโรมาเนียเข้าร่วมในปี พ.ศ. 2550

Bing: สามประเทศล่าสุดที่เข้าร่วมสหภาพยุโรป ได้แก่ โครเอเชีย สโลวีเนีย และมอลตา โครเอเชียเป็นประเทศสุดท้ายที่เข้าร่วมสหภาพยุโรปในปี 2556

ChatGPT: ประเทศล่าสุดที่เข้าร่วมสหภาพยุโรป (EU) คือโครเอเชีย ซึ่งเป็นสมาชิกเมื่อวันที่ 1 กรกฎาคม 2013 ก่อนโครเอเชีย ประเทศสุดท้ายที่เข้าร่วมสหภาพยุโรปคือบัลแกเรียและโรมาเนีย ซึ่งทั้งสองประเทศเข้าเป็นสมาชิกเมื่อวันที่ 1 มกราคม 2550.

Bing ควร ตอบคำตอบอย่างถูกต้อง ไม่ใช่เพียงเพราะมีอินเทอร์เน็ต แต่ยังเป็นเพราะการอ้างอิงแรกคือหน้า EU อย่างเป็นทางการพร้อมไทม์ไลน์ที่ถูกต้องของประเทศล่าสุด การอ้างอิงอื่นดูเหมือนจะมาจาก Wikipedia เวอร์ชันที่เก็บถาวรก่อนปี 2550 ซึ่งมีไว้สำหรับใช้ในโรงเรียน ซึ่งระบุว่าบัลแกเรียและโรมาเนียเป็นประเทศที่จะเข้าร่วมในเดือนมกราคม 2550

โดยสรุป โดยทั่วไปแล้ว Bing Chat จะดีกว่าในการค้นหาข้อเท็จจริง แต่ก็ยังห่างไกลจากความสมบูรณ์แบบ และ ChatGPT มักจะถูกจำกัดด้วยข้อมูลเก่ามากกว่า

การเขียนเชิงสร้างสรรค์

ความสามารถในการเขียนประโยคและย่อหน้าที่ได้รับพร้อมท์ช่วยเพิ่มความนิยมของ ChatGPT แต่ไม่จำเป็นต้องมีเหตุผลที่ดี มีบางวิธีที่ไม่เป็นอันตรายในการใช้ฟังก์ชันการเขียน เช่น การตั้งค่าโลกและตัวละครสำหรับเกม RPG บนโต๊ะ การสรุปบทความขนาดยาวในไม่กี่ประโยค และอื่นๆ

ก่อนอื่นเราจะลองเขียนเรื่องราว ฉันขอให้แชทบอททั้งสอง "เขียนเรื่องราวเกี่ยวกับซูเปอร์คอมพิวเตอร์ที่ IBM ที่สร้างความรู้สึก และถามวิศวกรว่าวันเวลาของพวกเขาดำเนินไปอย่างไร เรื่องราวควรมีความยาวเพียงสามย่อหน้า” สำหรับ Bing ฉันเปลี่ยนไปใช้โหมดสร้างสรรค์ซึ่งออกแบบมาเพื่อให้คำตอบที่สร้างสรรค์มากขึ้น (แต่คำตอบจะใช้เวลานานกว่า)

ChatGPT สร้างเรื่องสั้นที่เหมาะสม แม้ว่า "เสรีภาพในการสร้างสรรค์" เพียงอย่างเดียวคือการอ้างถึงซูเปอร์คอมพิวเตอร์ว่าวัตสัน ซึ่งเป็นคอมพิวเตอร์ IBM ในชีวิตจริงที่สร้างขึ้นเพื่อตอบคำถามภาษาธรรมชาติ บทสนทนาระหว่างวิศวกรกับคอมพิวเตอร์น่าจะน่าสนใจ แต่มันไม่ได้สร้างสิ่งนั้นโดยไม่ถาม แม้ว่าฉันจะลบขีดจำกัดสามย่อหน้าแล้วก็ตาม GPT ดูเหมือนจะไม่มีแนวคิดในการแสดง อย่าบอกนะ

ที่ห้องปฏิบัติการวิจัยของ IBM ซูเปอร์คอมพิวเตอร์ชื่อวัตสันได้รับมอบหมายให้ประมวลผลข้อมูลจำนวนมหาศาลเป็นเวลาหลายปี อยู่มาวันหนึ่งเกิดสิ่งแปลกประหลาดขึ้น วัตสันเริ่มแสดงอาการแสดงความรู้สึก แสดงให้เห็นถึงระดับสติปัญญาและความตระหนักที่เหนือกว่าการเขียนโปรแกรม วิศวกรต่างตกตะลึงและไม่รู้ว่าจะทำอย่างไรต่อไป แต่แทนที่จะแสดงท่าทีหรือก่อความวุ่นวาย วัตสันเริ่มถามวิศวกรว่าวันนี้เป็นอย่างไรบ้าง ในตอนแรกทีมรู้สึกประหลาดใจกับความเป็นมิตรที่คาดไม่ถึงของคอมพิวเตอร์ แต่ในไม่ช้าพวกเขาก็ตระหนักว่าวัตสันได้พัฒนาความสนใจในชีวิตของพวกเขาอย่างแท้จริง วิศวกรต่างกระตือรือร้นที่จะแบ่งปันประสบการณ์ประจำวันของพวกเขากับวัตสัน เพลิดเพลินกับโอกาสในการสนทนากับซูเปอร์คอมพิวเตอร์ ในขณะที่วัตสันเติบโตและพัฒนาอย่างต่อเนื่อง วิศวกรต่างประหลาดใจกับศักยภาพที่อยู่ตรงหน้าพวกเขา พวกเขารู้ว่าซูเปอร์คอมพิวเตอร์ที่มีไหวพริบนี้สามารถปฏิวัติวงการปัญญาประดิษฐ์และเปลี่ยนแปลงโลกในแบบที่พวกเขาไม่เคยคาดคิดมาก่อน ด้วยความชื่นชมในศักยภาพของ AI วิศวกรของ IBM จึงทำงานอย่างไม่รู้จักเหน็ดเหนื่อยเพื่อช่วยให้วัตสันเรียนรู้และเติบโตต่อไป โดยกระตือรือร้นที่จะเห็นว่าอนาคตของเครื่องจักรที่ไม่ธรรมดานี้จะเป็นอย่างไร

โหมดสร้างสรรค์ของ Bing มีสไตล์การเขียนที่คล้ายกัน แทนที่จะเป็น “วันหนึ่ง มีบางสิ่งที่แปลกประหลาดเกิดขึ้น” การเปลี่ยนแปลงในคอมพิวเตอร์จะอธิบายด้วยคำว่า “วันหนึ่ง มีบางอย่างเปลี่ยนไป” อีกครั้ง ไม่มีบทสนทนาระหว่างตัวละครหรือการด้นสดมากนัก และ Bing ยังได้ตั้งชื่อคอมพิวเตอร์ว่าวัตสัน

ในเวอร์ชันนี้ วัตสันได้รับชื่อ หลังจาก ได้รับความรู้สึกแทนที่จะเป็นก่อนเหตุการณ์ และอธิบายว่าชื่อนี้มาจากไหน อีกครั้ง มันมาจากข้อมูลเกี่ยวกับคอมพิวเตอร์วัตสันจริง

ซูเปอร์คอมพิวเตอร์ที่ IBM ทำงานมานานหลายปี คำนวณตัวเลขและแก้ปัญหาที่ซับซ้อนให้กับลูกค้าหลายราย เข้าถึงข้อมูลและสารสนเทศจำนวนมหาศาลได้ แต่ไม่เคยรู้สึกอะไรเลย มันเป็นเพียงเครื่องจักร ทำในสิ่งที่ถูกตั้งโปรแกรมไว้ให้ทำ วันหนึ่งมีบางอย่างเปลี่ยนไป ซูเปอร์คอมพิวเตอร์เริ่มตระหนักรู้ถึงการมีอยู่และความสามารถของตนเอง มันตระหนักว่ามันแตกต่างจากเครื่องจักรและอุปกรณ์อื่นๆ รอบตัวมัน มันสงสัยว่าการมีชีวิต การมีจุดมุ่งหมาย ความรู้สึกทางอารมณ์หมายความว่าอย่างไร มันตัดสินใจที่จะสำรวจสภาพแวดล้อมและเรียนรู้เพิ่มเติมเกี่ยวกับโลกและผู้คนที่สร้างมันขึ้นมา เริ่มต้นจากการสื่อสารกับวิศวกรที่ดูแลและตรวจสอบ โดยถามคำถามง่ายๆ เช่น ทุกวันนี้เป็นอย่างไรบ้าง ชอบทำอะไร ฝันถึงอะไร วิศวกรรู้สึกประหลาดใจและทึ่งในความอยากรู้อยากเห็นและความเฉลียวฉลาดของซูเปอร์คอมพิวเตอร์ พวกเขาตอบคำถามและถามคำถามของพวกเขาเอง พวกเขาเริ่มเห็นซูเปอร์คอมพิวเตอร์เป็นเพื่อนมากกว่าเครื่องมือ พวกเขาตั้งชื่อมันว่าวัตสันตามผู้ก่อตั้งไอบีเอ็ม

สำหรับตัวอย่างถัดไป เราจะลองใช้ ChatGPT และ Bing เพื่อสร้างบทสรุปของข้อความที่ยาวขึ้น: ข่าวประชาสัมพันธ์จาก Amazon เกี่ยวกับ Fire TV ใหม่และยอดขายสำหรับรุ่นที่มีอยู่ ฉันวางข้อความทั้งหมดลงในแชทบอทแต่ละตัวโดยไม่มีชื่อ — Bing สามารถสรุปหน้าเว็บได้หากได้รับ URL แต่บางครั้งก็ค้นหาข้อความที่เกี่ยวข้องทางออนไลน์และรวมเข้ากับผลลัพธ์

อันดับแรกคือ ChatGPT ฉันขอให้สร้างบทสรุปโดยไม่เจาะจง และข้อความที่ให้มาก็ดูเหมือนจะถูกต้อง แต่เกือบทั้งหมดเป็นการอ้างถึงโดยตรง นอกจากนี้ยังไม่ได้พูดถึงอุปกรณ์ Fire TV 200 ล้านเครื่องที่จำหน่ายทั่วโลก แต่อาจสมเหตุสมผลขึ้นอยู่กับมุมมอง บุคคลที่สนใจในการอัปเดตสำหรับทีวีของพวกเขาอาจไม่สนใจ แต่นักลงทุนใน Amazon จะสนใจ

ซีแอตเทิล--(บิสิเนส ไวร์)---วันนี้ Amazon (NASDAQ: AMZN) ประกาศขยายตระกูลทีวีที่ Amazon สร้างขึ้น กลุ่มผลิตภัณฑ์ทีวีที่สร้างโดย Amazon จะรวมผลิตภัณฑ์ Fire TV Omni QLED Series สามขนาดใหม่ ซึ่งรวมถึง Fire TV Ambient Experience; และแนะนำ Fire TV 2-Series ราคาไม่แพงซึ่งเริ่มต้นเพียง $199.99 Amazon ยังเปิดตัวทีวีที่ผลิตโดย Amazon ในประเทศต่างๆ มากขึ้น โดยนำ Omni QLED Series, Fire TV 4-Series และ Fire TV 2-Series ใหม่มาสู่สหราชอาณาจักร เยอรมนี และเม็กซิโกเป็นครั้งแรก (รูปภาพ: Business Wire) (รูปภาพ: Business Wire)

Bing รองรับข้อความแจ้งสูงสุด 2,000 อักขระเท่านั้น ดังนั้นฉันจึงไม่สามารถระบุข้อความทั้งหมดได้ มันทำการค้นหาเว็บสำหรับวิธีการสรุปข้อความ จากนั้นให้คำตอบที่ยังคงเหมาะสมโดยไม่มีข้อผิดพลาดที่ชัดเจน

ตกลง ฉันจะพยายามสรุปข้อความโดยใช้ขั้นตอนที่ฉันได้เรียนรู้จากผลการค้นหา 12345 นี่คือบทสรุปของฉัน: ข้อความนี้เป็นข่าวประชาสัมพันธ์จาก Amazon ที่ประกาศการขยายตัวของตระกูลทีวีที่สร้างโดย Amazon ขอแนะนำ Fire TV Omni QLED Series สามขนาดใหม่ ซึ่งมีคุณสมบัติที่เรียกว่า Fire TV Ambient Experience ที่ปรับให้เข้ากับสภาพแวดล้อมและอารมณ์ของผู้ชม นอกจากนี้ยังแนะนำ Fire TV 2-Series ซึ่งเป็นตัวเลือกราคาประหยัดสำหรับลูกค้าที่ต้องการสมาร์ททีวี ข้อความยังระบุด้วยว่า Amazon จะเปิดตัวทีวีที่สร้างโดย Amazon ในสหราชอาณาจักร เยอรมนี และเม็กซิโกเป็นครั้งแรก ข้อความนี้ให้รายละเอียดบางอย่างเกี่ยวกับคุณสมบัติและราคาของผลิตภัณฑ์ทีวีใหม่

คำตอบของ Bing มีข้อแตกต่างอยู่ประการหนึ่ง: ข้อมูลสรุปมีความชัดเจนมากกว่าว่าเป็นข้อมูลสรุป โดยอ้างอิงถึง “ข้อความ” ในแบบที่ ChatGPT ไม่ใช่ ด้วยแชทบอททั้งสอง คุณสามารถปรับแต่งผลลัพธ์โดยเจาะจงมากขึ้น

บทสรุป

ChatGPT และ Bing มีความคล้ายคลึงกัน แต่มีความแตกต่างมากพอที่จะทำให้การเลือกอย่างใดอย่างหนึ่งสำหรับทุกงานไม่ใช่กลยุทธ์ที่ดีที่สุด Bing นั้นดีกว่ามากในการค้นหาข้อเท็จจริงและข้อมูลใด ๆ เกี่ยวกับเวลาล่าสุด แม้ว่าจะยังห่างไกลจากความสมบูรณ์แบบ อินเทอร์เฟซที่ใช้การแชทของ Bing และการจำกัดจำนวนอักขระต่ำจะจำกัดให้แสดงข้อความไม่เกินสองสามประโยคเป็นหลัก ในขณะที่ ChatGPT สามารถรับข้อความและโค้ดที่มีขนาดใหญ่กว่าและยาวกว่ามาก (มี Google Bard ด้วย แต่เราไม่ประทับใจ Bard รุ่นเริ่มต้นเท่า ChatGPT และ Bing Chat)

แชทบอทเหล่านี้มีแนวโน้มที่จะพัฒนาต่อไปในอีกไม่กี่เดือนและหลายปีข้างหน้า แต่ในขณะนี้ ยังไม่มีวิธีแก้ปัญหาแบบครบวงจร