สำหรับผู้ทุพพลภาพและสำหรับ sybarites เท่านั้น นักพัฒนา OS ได้สร้าง การควบคุมด้วยเสียงคอมพิวเตอร์. อนุญาตให้ผู้ใช้ป้อนข้อมูลด้วยเสียง หลังจากออกเสียงคำบางคำ อุปกรณ์จะเริ่มการรู้จำเสียง โดยแปลงสัญญาณเสียงเป็นข้อมูลดิจิทัล หลังจากที่รับรู้ข้อมูลที่ป้อนอย่างถูกต้อง - โปรแกรมดำเนินการตามอัลกอริธึมการดำเนินการที่ระบุ - จะทำหน้าที่ที่แนบมากับคำสั่งเฉพาะ

ทุกอย่างค่อนข้างง่าย ระบบจดจำเสียงพูดไม่ถูกต้องเสมอไป ดังนั้นโปรแกรมควบคุมเสียงของคอมพิวเตอร์จึงไม่ได้ใช้อย่างเข้มข้นเพื่อแก้ปัญหาที่ซับซ้อนในการจัดการระบบปฏิบัติการ ใช้เพื่อทำหน้าที่พื้นฐาน: การเปิดและปิดไฟล์ การค้นหาในเครื่องและเครือข่าย ฯลฯ

ประวัติความเป็นมาของการพัฒนาการควบคุมด้วยเสียง

  • ระบบรู้จำเสียงของ Audrey แรกสร้างขึ้นในปี 1950 เธอถอดรหัสเฉพาะตัวเลขที่พูดเป็นเสียงเดียว
  • ในปี พ.ศ. 2505 ได้มีการสร้างระบบการรู้จำคำศัพท์ขึ้นเป็นครั้งแรก เธอถอดเสียงภาษาอังกฤษ 15 คำ
  • ด้วยการพัฒนาคอมพิวเตอร์ในปี 1990 โปรแกรม Dragon Dictate จึงได้รับการพัฒนา เธอจำคำได้ถึง 100 คำต่อนาที แต่มีราคาสูง
  • ในช่วงต้นปี 2000 แอปการรู้จำเสียง Google Voice Search ปรากฏบน iPhone ในปี 2010 มีการเพิ่มเครื่องมือค้นหาลงใน Android
  • สิริรวมอยู่ใน ซอฟต์แวร์โทรศัพท์ 4S ในช่วงต้นเดือนตุลาคม 2011;
  • ในปี 2014 Cortana ผู้ช่วยเสียงสำหรับ Windows ได้รับการแนะนำ

Cortana และความสามารถในการป้อนข้อมูลด้วยเสียงจนถึงปัจจุบัน

Cortana เป็นผู้ช่วยเสมือนในระบบปฏิบัติการ Windows บริการนี้ช่วยให้ผู้ใช้ในการวางแผนสิ่งต่าง ๆ เตือนพวกเขา
เมื่อมีการร้องขอ บริการจะช่วยรวบรวมข้อมูลเฉพาะ สร้างโครงสร้างที่ชัดเจน และนำเสนอต่อผู้ใช้ในรูปแบบที่ประมวลผลได้มากที่สุด
เป็นที่น่าสนใจว่าทันทีที่เปิดใช้งานผู้ช่วยเสมือนจะรวบรวมข้อมูลทั้งหมดเกี่ยวกับคำขอที่ป้อน ข้อมูลส่วนบุคคล พยายามปรับให้เข้ากับผู้ใช้แต่ละคนให้มากที่สุด


การควบคุมด้วยเสียงของคอมพิวเตอร์ Windows 7 ผ่านการใช้ผู้ช่วยเสมือนไม่สามารถทำได้ - มันรวมอยู่ในรุ่นที่สิบเท่านั้น แต่น่าเสียดายที่นักพัฒนาไม่สนใจที่จะปล่อยเวอร์ชันภาษารัสเซีย
การค้นหามีบทบาทหลักซึ่งสามารถเปิดได้ใน 10-ke ผ่าน "เริ่ม" ฟังก์ชันนี้กำหนดคำค้นหาเกือบทั้งหมด หากระบบไม่รู้จักรายการ คุณสามารถป้อนคำสั่งที่เหมาะสมในหน้าต่างป๊อปอัปและโปรแกรมควบคุมเสียงของคอมพิวเตอร์จะอ่านข้อมูลข้อความ

ช่วงเวลาที่ไม่พึงประสงค์คือการรวบรวมข้อมูลทั้งหมดที่ป้อนผ่านแป้นพิมพ์และส่งไปยัง Microsoft

โปรแกรมบุคคลที่สาม

พิมพ์

หลังจากติดตั้งเสร็จแล้ว ให้ไปยังขั้นตอนถัดไป - create บัญชีผู้ใช้. ที่นี่คุณต้องสร้างวลีสำคัญหลังจากนั้นจะมีเสียงแจ้งเตือนการเปิดใช้งาน


ต่อไป คุณจะต้องสร้างคำสั่งเสียงโดยไม่คำนึงถึงจุดประสงค์ คำสั่ง dog สามารถเปิดแอปพลิเคชันหรือทำอย่างอื่นได้ทั้งหมด




คุณเพียงแค่ต้องสร้างคำสั่งเสียงและกำหนดให้กับการกระทำเฉพาะ เหมาะสำหรับการดำเนินการขั้นพื้นฐานเท่านั้น - เปิดไฟล์ โฟลเดอร์ ฯลฯ ฟังก์ชันมีจำกัด

ลำโพง

ฟังก์ชันนี้กว้างกว่าในประเภท


การควบคุมด้วยเสียงของคอมพิวเตอร์ Windows 10 ทำให้ผู้ใช้สามารถเปิดและปิดไฟล์ ถ่ายภาพหน้าจอของหน้าจอ ปิดพีซีได้


การรู้จำเสียงใช้เวลานานกว่า 3-4 วินาที นี่เป็นเพราะความจริงที่ว่าคำพูดถูกแปลงเป็นข้อความก่อนและคอมพิวเตอร์จะรู้จักคำสั่งจากข้อมูลที่เป็นข้อความ

Laitis

มัน โปรแกรมฟรีซึ่งช่วยให้คุณควบคุมพีซีและกำหนดข้อความได้ หลังการติดตั้ง คุณต้องลงทะเบียนและใช้งานเพื่อความพึงพอใจของคุณ


ฟังก์ชันแก้ไขอัตโนมัติที่น่าสนใจเมื่อพิมพ์ คุณสามารถพูดว่า "เครื่องหมายคำพูด" และอักขระที่เกี่ยวข้องจะปรากฏในข้อความ

ความเป็นไปได้ของการควบคุมเสียงผ่าน Yandex.string

เมื่อใช้แอปพลิเคชันนี้ คุณสามารถค้นหาข้อมูลและไฟล์ในพื้นที่หรือเครือข่าย รีสตาร์ทหรือปิดเครื่องคอมพิวเตอร์ของคุณ มีฟังก์ชั่นเปิดโปรแกรมและไซต์ต่างๆ
ในการใช้โปรแกรม คุณต้องดาวน์โหลดและติดตั้งก่อน

แต่ในระหว่างการติดตั้ง คุณควรยกเลิกการเลือกรายการที่ผู้ผลิตซอฟต์แวร์เสนอให้ติดตั้งเบราว์เซอร์ เปลี่ยนการตั้งค่า มิฉะนั้น การติดตั้งจะใช้เวลานานขึ้นและการกำหนดค่าจะเปลี่ยนแปลงในเบราว์เซอร์
ในที่สุดบรรทัดจะถูกวางไว้ใกล้กับปุ่ม "เริ่ม" พูดว่า "ฟัง Yandex" แล้วหน้าต่างจะเปิดขึ้น

พูดคำร้อง.

หลังจากหยุดชั่วคราว แถบค้นหาจะเปิดขึ้นในเบราว์เซอร์ การจัดการการค้นหาด้วยวิธีนี้เป็นความคิดที่ดี
โดยทั่วไปแล้ว การควบคุมด้วยเสียงของคอมพิวเตอร์ยังไม่ได้รับการพัฒนา เนื่องจากมันถูกวาดขึ้นในจินตนาการ แต่ถึงแม้คุณสมบัติเหล่านั้นที่มีอยู่ในปัจจุบันก็น่าประทับใจอยู่แล้วและช่วยยกระดับการใช้พีซีในระดับใหม่ได้อย่างมาก

มีวันที่ดี!

คุณสามารถโต้ตอบกับคอมพิวเตอร์ได้ไม่เพียงแค่ใช้แป้นพิมพ์และเมาส์เท่านั้น นอกจากนี้ยังมีการควบคุมคำสั่งเสียง มียูทิลิตี้พิเศษที่ให้คุณทำสิ่งนี้ได้ ฟังก์ชันเหล่านี้ไม่เพียงแต่บันทึกข้อความจากการป้อนตามคำบอกหรือการถอดเสียงการบันทึกเสียงเท่านั้น คุณสามารถเรียกใช้แอปพลิเคชัน ใช้งานได้ และโดยทั่วไปแล้ว - ทำทุกอย่าง การควบคุมคอมพิวเตอร์ด้วยเสียงทำให้การทำงานกับพีซีทำได้ง่ายขึ้น คำสั่งจะถูกส่งไปอย่างรวดเร็วและง่ายดาย แน่นอนว่าถ้าคุณมีไมโครโฟน

เราจะแนะนำให้คุณรู้จักกับแอปพลิเคชันที่มีฟังก์ชันการทำงานที่คล้ายคลึงกัน

คุณลักษณะนี้สร้างขึ้นในภาษาอังกฤษ เวอร์ชั่น Windows. คุณต้องมีใบอนุญาต Enterprise หรือ Ultimate เพื่อใช้งาน แต่ยังอยู่ใน Russified ระบบปฏิบัติการคุณสามารถตั้งค่าการควบคุมด้วยเสียงและการป้อนตามคำบอกข้อความ ใช้หนึ่งในแอปพลิเคชันต่อไปนี้

แอพนี้เข้าใจง่าย

โปรแกรมยอดนิยม แม้ว่าจะมีข้อเสียอยู่บ้าง สาระสำคัญของงานนั้นเรียบง่าย: คุณตั้งค่าคำสั่งและเลือกสิ่งที่ควรทำ พิจารณาตั้งค่าแอปพลิเคชันนี้โดยใช้ตัวอย่างเฉพาะ

  1. ดาวน์โหลดและติดตั้ง มีเวอร์ชันฟรีและพรีเมียม ต้องซื้ออันที่สองเพื่อลองใช้บนคอมพิวเตอร์
  2. เรียกใช้ยูทิลิตี้ หน้าต่างข้อมูลพร้อมคำแนะนำจะปรากฏขึ้น
  3. แผงควบคุมมีฟังก์ชันต่างๆ มากมาย บางคนมีชื่อเดียวกัน จำเป็นต้องนำทางด้วยรูปภาพไม่ใช่ตามคำจารึก กดปุ่ม "เพิ่ม" - จะแสดงใบหน้า
  4. ระบุชื่อโปรไฟล์และคีย์เวิร์ดเพื่อระบุคำสั่ง ตัวอย่างเช่น เขียนว่า "เปิด" หากคุณกำลังจะตั้งค่าการเปิดแอปพลิเคชันบางตัวด้วยเสียง หรือ "ไปที่" เพื่อไปที่ไซต์ทันทีโดยไม่ต้องป้อนที่อยู่
  5. ตอนนี้เราต้องบันทึกคำสั่งนี้ในรูปแบบของภาพเสียง คลิกที่ปุ่มที่มีวงกลมสีแดง และออกเสียงวลีที่ต้องการลงในไมโครโฟนอย่างชัดเจน
  6. ยืนยันการเปลี่ยนแปลง ตัวเลือกที่ระบุจะปรากฏในรายการในหน้าต่างประเภท โปรแกรมจะจดจำสิ่งที่คุณบันทึกไว้ใน "เครื่องบันทึกเสียง"
  7. หลังจากนั้นให้ระบุสิ่งที่จะเรียกใช้เพื่อรันคำสั่ง คลิกปุ่ม "เพิ่ม" ซึ่งดูเหมือนมือที่มีสัญลักษณ์ "+" (บวก)
  8. เลือกรูปแบบข้อมูล: ไฟล์/ยูทิลิตี้, หน้าเว็บ, บริการ OS ภายในบางอย่าง ใส่ช่องทำเครื่องหมายที่คุณต้องการ
  9. ค้นหาแอปพลิเคชันที่คุณต้องการเปิดใช้ด้วยเสียงของคุณ ปล่อยให้มันเป็นเช่น Microsoft Word คุณจึงสามารถเริ่มแก้ไขข้อความหรือเขียนบทความได้อย่างรวดเร็ว
  10. ในหน้าต่างเดียวกัน ให้จดส่วนที่สองของคำสั่ง สรุปได้ว่า "เปิดพระคำ" คำแรกจะเปิดใช้งาน Type คำที่สองจะเปิดใช้งานยูทิลิตี้ที่เกี่ยวข้อง
  11. คลิกเพิ่ม
  12. คุณสามารถแนบหลายแอปพลิเคชันเข้ากับฟังก์ชัน "เปิด" ฟังก์ชันเดียวได้ ด้วยวิธีนี้ คุณจะควบคุมการเปิดตัวโดยไม่ต้องแตะเมาส์และอุปกรณ์ต่อพ่วงอื่นๆ ที่ติดตั้งบนคอมพิวเตอร์
  13. หากจำเป็น ให้แก้ไขพารามิเตอร์เพิ่มเติม
  14. หากต้องการตรวจสอบว่าใช้งานได้หรือไม่ ให้คลิกที่ "เริ่มพูด" แล้วพูดคำสั่ง

โปรแกรมนี้ทำงานร่วมกับภาษารัสเซีย แต่ก็ไม่ได้รับรู้อย่างถูกต้องเสมอไป จำเป็นต้องพูดเสียงดังชัดเจนด้วยเสียงกลไก

  • ไม่จำเป็นต้องมีความรู้ภาษาอังกฤษ
  • การสร้างคำสั่งด่วน
  • ไม่มีการจดจำข้อความ
  • ฟังก์ชันที่จำกัด คุณสามารถเปิดยูทิลิตี้และเพจบนอินเทอร์เน็ตเท่านั้น
  • บางครั้งโปรแกรมจะรับรู้เสียงรบกวนจากภายนอกเป็นคำสั่ง ด้วยเหตุนี้ สิ่งแปลกประหลาดจึงเกิดขึ้นบนพีซี
  • คุณไม่สามารถทำงานกับผู้เล่นได้

สุนทรพจน์

แอปพลิเคชั่นอื่นสำหรับการจัดการคอมพิวเตอร์

  1. ในการเริ่มต้นครั้งแรก หน้าต่างจะเปิดขึ้นพร้อมตัวเลือกหมวดหมู่: พีซีหรืออินเทอร์เน็ต
  2. นอกจากนี้ยังมีคำอธิบายว่าคีย์ผสมใดเพื่อเปิดใช้งานยูทิลิตี้ ซึ่งสามารถเปลี่ยนแปลงได้ในการตั้งค่า
  3. คลิกที่ "อินเทอร์เน็ต" ตัวอย่างเช่น หน้าต่างจะเปิดขึ้นพร้อมช่องป้อนข้อมูลหลายช่อง: สำหรับข้อความคำสั่งและสำหรับ URL ของเว็บไซต์ คุณสามารถเขียนคำว่า "Yandex" และที่อยู่ของหน้านี้
  4. คลิกเพิ่ม
  5. กดปุ่มที่ระบุบนหน้าต่างหลักค้างไว้
  6. พูดคำสั่งเพื่อให้ยูทิลิตี "จดจำ" ได้
  • เปิดใช้งานทั้งปุ่มและระดับเสียง
  • เมื่อเริ่มต้น คุณสามารถปรับเทียบไมโครโฟนได้
  • ฟังก์ชันที่จำกัด

ลำโพง

อินเทอร์เฟซได้รับการออกแบบในแบบมินิมอล

คำสั่งในแอปพลิเคชันกำหนดค่าโดยใช้คำที่พิมพ์ ไม่ใช่การป้อนตามคำบอก มีกลไกการจดจำข้อความภายใน หน้าที่หลัก:

  • สร้างภาพหน้าจอตามคำสั่ง
  • เปลี่ยนรูปแบบแป้นพิมพ์บนคอมพิวเตอร์ของคุณ
  • การเปิดโปรแกรมและไฟล์
  • เสร็จสิ้นการทำงาน
  • คุณไม่สามารถทำการบันทึกเสียงกับทีมงานได้ ยูทิลิตีรู้จักฉลาก
  • คุณต้องใช้แป้นพิมพ์เพื่อควบคุม หากใช้ปุ่มที่ระบุเพื่อวัตถุประสงค์อื่นจะไม่สะดวก
  • คุณต้องมีการเชื่อมต่ออินเทอร์เน็ตที่เสถียร

Gorynych

ฮีโร่ของนิทานพื้นบ้านรัสเซียจะช่วยคุณ

โปรแกรมควบคุมคอมพิวเตอร์ด้วยเสียง "Gorynych" เป็นผลิตภัณฑ์ในประเทศ ดังนั้นจึงมีโมดูลการรู้จำเสียงพูด "ดั้งเดิม" มัน "ปรับ" ให้เข้ากับเสียงต่ำและเสียงสูงของผู้ใช้ ด้วยยูทิลิตี้นี้ คุณสามารถทำงานในระบบได้อย่างเต็มที่ ไม่ใช่แค่เปิดไฟล์และหน้าเว็บ

  • มีการรองรับภาษารัสเซียและภาษาอังกฤษ
  • การรับรู้ข้อความ ใส่เสียงถึงบรรณาธิการใด ๆ
  • ฟังก์ชั่นเสริม
  • จำเป็นต้องสร้างคำสั่งสำหรับแต่ละกระบวนการอย่างอิสระ แท้จริงแล้วคุณต้องจดพจนานุกรม

การรู้จำเสียงของ Windows

โปรแกรมที่สร้างขึ้นในระบบปฏิบัติการภาษาอังกฤษ เมื่อต้องการใช้งาน คุณต้องติดตั้งชุดภาษาที่เหมาะสม ทีมรัสเซียจะไม่ทำงานกับเธอ ในการควบคุมพีซีด้วย คุณจะต้องพูดภาษาของมัน ในการเข้าถึงในแผงควบคุม การตั้งค่า Windowsเปิดเมนู " มาตรฐานภูมิภาคและภาษา" (อยู่ในหมวด "ชั่วโมง ภาษา ภูมิภาค") และตั้งค่า "ภาษาอังกฤษ" ในทุกแท็บ หากทุกอย่างถูกต้อง และคุณได้ติดตั้งชุดภาษาที่จำเป็นแล้ว Windows จะ "เปลี่ยน" เป็นภาษาอังกฤษ และยูทิลิตี้นี้จะพร้อมใช้งาน จะดีกว่าที่จะไม่ลองใช้วิธีนี้หากคุณไม่รู้ภาษาต่างประเทศดีพอ

วิธีนี้เหมาะถ้าคุณพูดภาษาอังกฤษ

สาธารณูปโภคอื่นๆ

มีแอพพลิเคชั่นมากมายสำหรับจัดการคำสั่งดังกล่าว:

  • ส่วนขยายเบราว์เซอร์ อำนวยความสะดวกในการท่องเว็บ ที่ Google Chromeมีฟังก์ชั่นที่คล้ายกันอยู่แล้ว - การป้อนข้อมูลด้วยเสียงในรูปแบบการค้นหา ตัวเลือกนี้มีอยู่ในแผนที่ออนไลน์บางแผนที่ ช่วยให้คุณค้นหาที่อยู่ได้อย่างรวดเร็ว
  • ประเภทเสียง
  • เรียลสปีกเกอร์
  • คำพูดของเว็บ

รายการซอฟต์แวร์จดจำข้อความและเขียนตามคำบอก

แน่นอนว่าการควบคุมด้วยเสียงนั้นดี แต่ยูทิลิตี้สำหรับ OCR และการพิมพ์จากการเขียนตามคำบอกนั้นมีประโยชน์ เมื่อรวบรวมรายงานจำนวนมาก ประกาศนียบัตร การเขียนความคิดของคุณง่ายขึ้นโดยการเปล่งเสียงลงในไมโครโฟนบนคอมพิวเตอร์ นี่คือบางส่วนของยูทิลิตี้เหล่านี้:

  • การเขียนตามคำบอก
  • มังกรพูดอย่างเป็นธรรมชาติ
  • ถาวรมือถือ

ผลิตภัณฑ์ที่ให้คุณกำหนดข้อความไปยังคอมพิวเตอร์

คุณสามารถตั้งค่าคำสั่งเสียงในระบบปฏิบัติการ ในการดำเนินการนี้ ต้องติดตั้งโปรแกรมที่เหมาะสมบนคอมพิวเตอร์ ด้วยวิธีนี้ คุณสามารถทำงานบนพีซี นอนบนโซฟา หรือนั่งพักผ่อนบนเก้าอี้นวม คุณจะมีมือว่าง หากไมโครโฟนดีและเก็บเสียงได้แม้ห่างไกลหรือเงียบ คุณก็ไม่จำเป็นต้องนั่งข้างๆ คุณสามารถ "พูดคุย" กับคอมพิวเตอร์พร้อมกันและเขียนโน้ตลงในสมุดบันทึก วาด ถืออะไรบางอย่างได้ ใช่แม้กระทั่งเย็บและถัก ด้วยคำสั่ง การโต้ตอบกับพีซีจะง่ายขึ้นมาก ในการเปิดใช้งานยูทิลิตี้เหล่านี้บางอย่าง คุณต้องกดปุ่มบนแป้นพิมพ์ซึ่งไม่สะดวกนัก

แต่ก็มีแง่ลบเช่นกัน หากคุณเผลอพูดคำคำสั่ง แอปพลิเคชันที่ไม่จำเป็นโดยสมบูรณ์ในตอนนี้จะเปิดขึ้นหรือเบราว์เซอร์จะไปที่ไซต์ที่ไม่ถูกต้อง จะใช้อะไรและใช้หรือไม่ - ขึ้นอยู่กับคุณ

วันนี้เราจะพูดถึงคำพูดของเรา คุณชอบ ควบคุมคอมพิวเตอร์ด้วยเสียงโดยไม่ต้องใช้นิ้วช่วย? และอย่างที่พวกเขาพูดด้วยพลังแห่งความคิด! จริงอยู่ เราจะไม่ควบคุมคอมพิวเตอร์ด้วยพลังแห่งความคิด แต่ด้วยพลังเสียง มันค่อนข้างจริง

พิมพ์โปรแกรม- นี่เป็นหนึ่งในซอฟต์แวร์ที่ดีที่สุดสำหรับการควบคุมคอมพิวเตอร์ผ่านเสียง บนเว็บไซต์ในความคิดเห็นของโปรแกรมนี้ ความคิดเห็นมาบรรจบกัน

จริงอยู่ มันมีข้อบกพร่อง แต่เพิ่มเติมในภายหลัง อย่างไรก็ตาม หากคุณสนใจ อ่านบทวิจารณ์ของฉัน

คุณสามารถดาวน์โหลดโปรแกรมได้ที่นี่: http://freesoft.ru/type

วิธีการใช้งาน? ขั้นแรก ให้เรียกใช้และดูปุ่มควบคุมหลัก:

โปรแกรมยินดีต้อนรับเราและให้คำแนะนำเกี่ยวกับวิธีใช้ Type ทันที ในตอนเริ่มต้น เราจะกดปุ่ม "เพิ่ม" และเขียนคำนั้นลงไป เช่น "เปิด" เมื่อต้องการทำสิ่งนี้ ให้พูดคำนี้ลงในไมโครโฟน:

จากนั้นคลิกเพิ่ม ดังนั้นเราจึงบันทึกคำว่า "เปิด" ในโปรแกรมด้วยเสียงของเรา คุณสามารถพูดคำอื่นๆ ลงในไมโครโฟนได้ สิ่งสำคัญคืออย่าสับสน

ขั้นตอนต่อไปคือการเพิ่มคำสั่ง ไปที่จุดนี้:

จากนั้นเราทำเครื่องหมายที่ช่องถัดจากรายการที่เราต้องการ:

เลือกโปรแกรม แอปพลิเคชัน หรือการดำเนินการ แล้วคลิกปุ่มบันทึกสีแดง หากคอมพิวเตอร์ยอมรับเสียงของเรา ให้คลิก "เพิ่ม":

และตอนนี้คำสั่งเสียงหนึ่งคำสั่งจะปรากฏในโปรไฟล์ของเรา ในกรณีนี้อันที่เปิด 7-Zip:

และตอนนี้โดยการกดปุ่มสุดท้าย "เริ่มพูด"

เราพูดวลี "open Seven Zip" ในกรณีของฉัน ทุกอย่างจะได้ผล และโปรแกรม 7-zip จะเปิดขึ้น จำวลีนี้: ซิมเปิด? นี่คือสิ่งที่เหมือนกัน

โปรแกรมทำงานไม่ถูกต้องเสมอไป ตอนนี้ภาษารัสเซียอันยิ่งใหญ่ยังไม่ได้รับการศึกษาอย่างเต็มที่จากโปรแกรมเมอร์นักภาษาศาสตร์ ... แต่ก็ยังดีที่คอมพิวเตอร์จะเชื่อฟังคุณ

ดังนั้นสำหรับการทดสอบและความอยากรู้ซ้ำซาก โปรแกรม Typle จึงเหมาะสม 100%

ในวิดีโอนี้ คุณสามารถดูประวัติของการสร้างเครื่องมือเสียงแรกและสิ่งอื่นที่เราต้องดำเนินการ:

มีชื่อที่คล้ายคลึงกันอื่น ๆ ของโปรแกรมเช่น Gorynych, Perpetuum, Dictograph, Voice Commander แต่ทั้งหมดนั้นไม่ใช่ "อันนั้น" อย่าผ่านการวิพากษ์วิจารณ์โปรแกรมที่คู่ควร

ฉันใช้เวลา 5 นาทีในการเรียนรู้โปรแกรมนี้ ค่อนข้างนาน (ส่วนใหญ่ฉันเข้าใจโปรแกรมดังกล่าวใน 1-2 นาที) หากคุณมีคำถามใด ๆ - เขียน แล้วเจอกันนะเพื่อนๆ :)!

ในอีกความพยายามที่จะนำแนวคิดจากภาพยนตร์นิยายวิทยาศาสตร์มาใช้ ยักษ์ใหญ่ด้านเทคโนโลยีเริ่มทำงานกับผู้ช่วยเสมือนทีละคน ในการประชุม Google I/O 2016 บริษัท แนะนำ Google Assistant เช่นเดียวกับแอนะล็อกของ Amazon Echo - home ผู้ช่วยเสียงหน้าแรกของ Google

บริษัทใหญ่รายสุดท้ายที่เข้าร่วมการแข่งขันผู้ช่วยเสมือน มาดูกันว่ามีคู่แข่งอะไรบ้าง (รวมถึงสตาร์ทอัพด้วย)

10 ผู้ช่วยเสมือน: ภาพรวม

Alexey Zenkov

อันดับแรก ให้จำไว้ว่า Google Now คืออะไร

Google/Google Now ค้นหาด้วยเสียง

ลักษณะเฉพาะ:เร็ว. แม่นยำอย่างยิ่งเมื่อสร้างเส้นทาง มันสร้างความตื่นตระหนกให้กับเที่ยวบิน การจอง และรายละเอียดอื่นๆ ของคุณ กับบางอย่าง แอปพลิเคชันบุคคลที่สาม: จัดการโน้ต ข้อความ และการเล่นเพลง

ข้อบกพร่อง:บางครั้งมันก็รบกวนคุณด้วยความคิดริเริ่มที่มากเกินไป (เช่น แสดงผลการแข่งขันของทีมที่คุณไม่สนใจ หรือเส้นทางกลับบ้านจากสถานที่ที่มีชื่อเสียง) ไร้ประโยชน์เมื่อจัดการ "บ้านอัจฉริยะ" การทำงานเกี่ยวกับการผสานรวมกับแอปพลิเคชันของบุคคลที่สามดูเหมือนจะหยุดชะงัก

ระดับมนุษยชาติ:โมฆะ. ไม่เอื้อต่อการสื่อสาร ไม่มีแม้แต่ชื่ออื่นนอกจาก Google

สรุป:ในทางทฤษฎีแล้ว การครอบครองข้อมูลส่วนบุคคลจำนวนมากและการเข้าถึงเสิร์ชเอ็นจิ้นควรทำให้ Google เป็นผู้นำในอุตสาหกรรม แต่บริษัทยังไม่ได้คิดหาวิธีใช้ประโยชน์จากข้อดีของตนเพื่อสร้างผู้ช่วยที่สามารถเข้าใจผู้ใช้ได้ วันนี้ Google Now และ ค้นหาด้วยเสียงพวกเขาแข่งขันกันอย่างเท่าเทียมกันกับ Siri แต่ยังไม่ถึงระดับใหม่ของการพัฒนา

และตอนนี้ - เกี่ยวกับคู่แข่ง

แอปเปิ้ล สิริ

อะไร:ผู้ช่วยเสียงที่สามารถพูดคุยกับผู้ใช้และให้คำแนะนำเชิงรุก เปิดใช้งานโดยกดปุ่มโฮมบนและ iPad ค้างไว้ การสนับสนุนผู้ช่วยเพิ่งปรากฏบน Apple TV และ Apple Watch

ลักษณะเฉพาะ:ใช้งานง่ายบนอุปกรณ์ iOS เข้าใจคำพูดที่เป็นธรรมชาติ ข้อมูลข่าวสาร พยากรณ์อากาศ กีฬา ภาพยนตร์ เส้นทาง และธุรกิจในท้องถิ่นเป็นอย่างดี สามารถบอกคุณได้ว่าจะดูอะไรในทีวี สามารถโต้ตอบกับองค์ประกอบบางอย่างของ "บ้านอัจฉริยะ"

ข้อบกพร่อง:ไม่สามารถโต้ตอบกับแอปพลิเคชันและบริการอื่นๆ ส่วนใหญ่ได้ ทำงานช้ากว่าคู่แข่งบางราย

ระดับมนุษยชาติ:ไม่สามารถรักษาการสนทนาได้เต็มที่ แต่ในบางจุดก็แสดงให้เห็นถึงภูมิปัญญาของเขาเอง เสียงผู้หญิงฟังดูค่อนข้างเป็นมนุษย์

ข้อบกพร่อง:ใช้งานได้ดีบน Windows - แพลตฟอร์มที่นักพัฒนาและบางทีผู้ใช้อาจสนใจน้อยที่สุด การใช้ตัวช่วยบน Android และ iOS นั้นยากกว่าและมีฟังก์ชันน้อยกว่า

ระดับมนุษยชาติ:เขาชอบเรื่องตลกโดยเฉพาะเรื่องซ้ำซากจำเจ มีรายการคำตอบที่มีไหวพริบมากมายสำหรับคำถามทั่วไปพร้อม สามารถอ่านข้อความที่ตัดตอนมาจากเช็คสเปียร์

สรุป:หลังจากหลายปีที่อยู่ภายใต้เงาของ Siri และ Google Cortana ก็กลายเป็นแชทบ็อตที่น่าสนใจยิ่งขึ้น Microsoft ต้องการสร้างของตัวเอง ผู้ช่วยเสียงข่าวกรองพื้นฐานสำหรับบ็อตอื่นๆ ทั้งหมดที่สามารถจัดการการเดินทาง การนัดหมาย รายการสิ่งที่ต้องทำ และสิ่งอื่น ๆ ของคุณ รวมทั้งเพิ่มระดับการผสานรวมกับผลิตภัณฑ์อื่นๆ ของ Microsoft เช่น Office บริษัทมีเป้าหมายที่จะสร้างเปลือกใหม่สำหรับการประมวลผลหลังพีซี แต่ยังเร็วเกินไปที่จะบอกว่ามันจะสำเร็จหรือไม่

Facebook M

อะไร:ขับเคลื่อนบางส่วน ส่วนหนึ่งเป็นมนุษย์ และยังอยู่ระหว่างการพัฒนา M จะเป็นผู้ช่วยแบบข้อความในสภาพแวดล้อม Facebook Messenger

ลักษณะเฉพาะ:จะพยายามทำทุกอย่างที่ขอ

ข้อบกพร่อง:มันยังไม่ใช่ผลิตภัณฑ์สำเร็จรูปและจะไม่นาน ใช้ได้เฉพาะกับผู้ใช้จำนวนน้อยในซานฟรานซิสโก

ระดับมนุษยชาติ:สูงมากเนื่องจากผู้คนจะมีส่วนร่วมในการตอบคำถาม จากข้อมูลของ Wired บริษัทหวังว่าเมื่อเวลาผ่านไป M จะได้เรียนรู้จากโอเปอเรเตอร์เหล่านี้และสามารถทำงานได้อย่างอิสระมากขึ้น

สรุป:ในขณะนี้ M เป็นมากกว่าแค่ความคิดเพียงเล็กน้อย แต่เมื่อพิจารณาจากความสนใจของ Facebook ในแชทบ็อตโดยทั่วไป จึงไม่น่าแปลกใจเลยที่ M จะกลายเป็นอัจฉริยะ

X.ai

อะไร:หนึ่งในผู้ช่วยเสมือนไม่กี่คนที่มีฟังก์ชันเดียว ทำงานผ่านอีเมลเท่านั้น ซึ่งเขาสามารถนัดหมายตามคำขอของคุณได้

ลักษณะเฉพาะ:รู้กำหนดการและความชอบของคุณ เจรจากับผู้เข้าร่วมคนอื่นๆ ให้กับคุณ

ลักษณะเฉพาะ: Viv สัญญาว่าผลิตภัณฑ์ของพวกเขาจะสามารถเข้าใจคำถามที่ซับซ้อนได้ เช่น: “อุณหภูมิใกล้สะพาน Golden Gate จะเกิน 20 องศาในวันมะรืนหลัง 17.00 น. หรือไม่” กำลังดำเนินการเพื่อให้มั่นใจว่าสามารถใช้งานร่วมกับแอปพลิเคชันของบุคคลที่สามได้

ข้อบกพร่อง:จนถึงตอนนี้ นอกเหนือจากการนำเสนอที่เตรียมไว้แล้ว ยังไม่มีหลักฐานว่าทุกอย่างทำงานตรงตามที่ระบุไว้

ระดับมนุษยชาติ:ค่าโสตทัศนูปกรณ์และคำตอบที่เป็นรูปธรรมมากกว่า คำอธิบายโดยละเอียด. ปัญญาเป็นที่น่าสงสัย

ข้อบกพร่อง:ความเป็นไปได้ในการรวมเข้ากับแอปพลิเคชันของบุคคลที่สามนั้นมีจำกัด และไม่สามารถเปิดบริการได้โดยตรงบน iOS หรือ Android คำขอที่ผู้ช่วยไม่รู้จักจะถูกเปลี่ยนเส้นทางไปที่ Ask.com

ระดับมนุษยชาติ:ไม่เอื้อต่อการสนทนาที่ยาวนาน แต่รู้วิธีตอบคำถามเพิ่มเติม

สรุป:ดูเหมือนว่า แอปพลิเคชั่นมือถือ Hound มีอยู่จริงเพียงเพื่อแสดงความสามารถของบริการ Houndify ซึ่ง SoundHound วางแผนที่จะขายให้กับบริษัทอื่น หากทุกอย่างเป็นไปด้วยดี เราจะไม่รู้ด้วยซ้ำว่าเรากำลังใช้มันอยู่

ออซโล

อะไร: AI หน้าที่หลักในขณะนี้คือการค้นหาร้านกาแฟ บาร์ และร้านอาหาร มีให้สำหรับผู้ใช้จำนวนจำกัด

ลักษณะเฉพาะ:ค้นหาและรวมข้อมูลจากหลายแหล่ง รวมทั้ง Yelp และ Foursquare จากนั้นนำเสนอทุกอย่างในรูปแบบการ์ดที่สะดวก พยายามสื่อสารด้วยการถามและตอบคำถามติดตามผล เช่น "ขณะนี้เปิดสถานที่ใดบ้าง" หรือ “มีเมนูอะไรบ้าง”

ข้อบกพร่อง:ฟีเจอร์ที่จำกัด เว้นแต่ผู้สร้าง Ozlo จะเพิ่มคุณสมบัติใหม่ เมื่อเรียนรู้ AI จะขึ้นอยู่กับผู้ใช้เป็นอย่างมาก

ระดับมนุษยชาติ:หลีกเลี่ยงมารยาทที่ไม่จำเป็น เพียงทักทายสั้นๆ ตามชื่อเท่านั้น

สรุป: Ozlo ก็ไม่ต่างจากแชทบ็อตอื่นๆ มากมาย หากไม่มีโอกาสในการสร้างสิ่งที่ใหญ่กว่านี้ ความสามารถในการรวมข้อมูลจากหลายแหล่งในเอาต์พุตเดียวนั้นไม่เหมือนใคร แต่ยังไม่ชัดเจนว่านักพัฒนาจะสามารถตระหนักถึงศักยภาพสูงสุดที่พวกเขาอ้างสิทธิ์ได้หรือไม่ ตราบใดที่แผนธุรกิจของ Ozlo จำกัดอยู่แค่แอป การรวบรวมข้อมูลที่จำเป็นสำหรับการฝึกอบรมอาจเป็นเรื่องยาก

SpeakToIt Assistant.ai

อะไร:หนึ่งในหลาย ๆ สำเนาของ Siri ใน App Store การค้นหา Siri จะแสดงโปรแกรมที่คล้ายกันมากมาย เช่น คำสั่งเสียง เลขานุการเสียง และผู้ช่วย

ลักษณะเฉพาะ:ไม่ต่างจาก Siri แต่สามารถเรียนรู้คำสั่งของผู้ใช้เพื่อเปิดใช้งานรายการคุณสมบัติต่างๆ

ข้อบกพร่อง:ไม่มีประโยชน์เท่ากับผู้ช่วยในตัวในสมาร์ทโฟนของคุณ และไม่สะดวกเท่า

ระดับมนุษยชาติ:ฟังดูค่อนข้างไม่เป็นธรรมชาติ แต่แสดงภาพตัวเองเป็นผู้ช่วยมนุษย์ที่มีเพศและ รูปร่างสามารถเปลี่ยนแปลงได้

สรุป:สำเนาของ Siri เหล่านี้บางส่วนดูเหมือนของที่ระลึกในอดีตเมื่อไม่ได้ทั้งหมด รุ่นไอโฟนสามารถทำงานร่วมกับผู้ช่วยที่เป็นกรรมสิทธิ์ของ Apple และจำเป็นต้องเปลี่ยน ไม่ว่าในกรณีใด ดูเหมือนว่าผู้สร้างของพวกเขาจะทราบดีว่าวิธีการดังกล่าวจะไม่อนุญาตให้พวกเขาประสบความสำเร็จ ตัวอย่างเช่น SpeakToIt ย้ายไปสร้างชุดเครื่องมือที่นักพัฒนารายอื่นสามารถใช้เพื่อสร้างแชทบ็อตของตนเองได้