วิธีใช้การเรียนรู้ของเครื่องเพื่อแก้ปัญหา TSP?

ในฐานะซัพพลายเออร์ TSP (Trisodium Phosphate) ฉันได้เห็นภูมิทัศน์ที่พัฒนาขึ้นของอุตสาหกรรมและความต้องการที่เพิ่มขึ้นสำหรับการแก้ปัญหาที่มีประสิทธิภาพ ปัญหาพนักงานขายการเดินทาง (TSP) ในขณะที่ดูเหมือนจะไม่เกี่ยวข้องอย่างรวดเร็วครั้งแรกแบ่งปันพื้นฐานร่วมกับธุรกิจของเราในแง่ของการเพิ่มประสิทธิภาพและประสิทธิภาพ ในบล็อกนี้ฉันจะสำรวจว่าการเรียนรู้ของเครื่องสามารถใช้ในการแก้ปัญหา TSP ได้อย่างไรและแนวคิดเหล่านี้สามารถนำไปใช้กับธุรกิจการจัดหา TSP ของเราได้อย่างไร

Sodium-Acid-Pyrophosphate Trisodium-Phosphate

การทำความเข้าใจปัญหาพนักงานขายที่เดินทาง

ปัญหาพนักงานขายการเดินทางเป็นปัญหาการเพิ่มประสิทธิภาพ combinatorial ที่รู้จักกันดี เป้าหมายคือการหาเส้นทางที่สั้นที่สุดที่พนักงานขายสามารถใช้ในการเยี่ยมชมชุดเมืองหนึ่งครั้งและกลับไปที่จุดเริ่มต้น ในทางคณิตศาสตร์ได้รับชุดของ (N) เมืองและระยะทางระหว่างแต่ละเมืองแต่ละคู่ปัญหาคือการหาการเปลี่ยนแปลงของเมือง (n) ที่ลดระยะทางทั้งหมดที่เดินทาง

ความซับซ้อนของ TSP เติบโตอย่างทวีคูณด้วยจำนวนเมือง สำหรับ (N) เมืองมีเส้นทาง ((n - 1)!/2) เส้นทางที่เป็นไปได้ เมื่อ (n) เพิ่มขึ้นจำนวนของการแก้ปัญหาที่เป็นไปได้จะกลายเป็นดาราศาสตร์ ตัวอย่างเช่นสำหรับ 10 เมืองมีเส้นทางที่เป็นไปได้ 181440 เส้นทางและสำหรับ 20 เมืองมีเส้นทางที่เป็นไปได้ประมาณ (6 \ times10^{16}) สิ่งนี้ทำให้ยากมากที่จะหาวิธีแก้ปัญหาที่ดีที่สุดโดยใช้วิธีการเดรัจฉาน - แรง

วิธีการดั้งเดิมในการแก้ปัญหา TSP

ก่อนการกำเนิดของการเรียนรู้ของเครื่องมีวิธีการดั้งเดิมหลายวิธีในการแก้ปัญหา TSP:

Brute - Force Search: ดังที่ได้กล่าวไว้ก่อนหน้านี้วิธีนี้เกี่ยวข้องกับการตรวจสอบทุกเส้นทางที่เป็นไปได้และเลือกเส้นทางที่มีระยะทางที่สั้นที่สุด ในขณะที่รับประกันการแก้ปัญหาที่ดีที่สุด แต่ก็เป็นไปไม่ได้ที่คำนวณได้สำหรับเมืองจำนวนมาก
อัลกอริทึมฮิวริสติก: เหล่านี้เป็นอัลกอริทึมที่หาวิธีแก้ปัญหาที่ดีได้อย่างรวดเร็ว แต่ไม่รับประกันการแก้ปัญหาที่ดีที่สุด ตัวอย่างรวมถึงอัลกอริทึมเพื่อนบ้านที่ใกล้ที่สุดซึ่งพนักงานขายมักจะไปเยี่ยมชมเมืองที่ไม่ได้เข้าชมที่ใกล้ที่สุดเสมอและอัลกอริทึม 2 - OPT ซึ่งปรับปรุงเส้นทางที่กำหนดโดยการสลับขอบคู่
การเขียนโปรแกรมแบบไดนามิก: วิธีการนี้แบ่งปัญหาออกเป็นปัญหาย่อยที่เล็กลงและแก้ปัญหาซ้ำ ๆ อย่างไรก็ตามมันยังมีความซับซ้อนเวลาสูงและ จำกัด อยู่ที่ขนาดปัญหาที่ค่อนข้างเล็ก

วิธีการเรียนรู้ของเครื่องเพื่อแก้ปัญหา TSP

การเรียนรู้ของเครื่องนำเสนอวิธีใหม่และทรงพลังในการจัดการกับ TSP นี่คือเทคนิคการเรียนรู้ของเครื่องที่ใช้กันทั่วไปที่ใช้:

เครือข่ายประสาท

เครือข่ายประสาทโดยเฉพาะอย่างยิ่งเครือข่ายประสาท (RNNs) และตัวแปรของพวกเขาเช่นเครือข่ายหน่วยความจำระยะสั้นระยะยาว (LSTMS) ถูกนำมาใช้เพื่อแก้ปัญหา TSP แนวคิดพื้นฐานคือการฝึกอบรมเครือข่ายประสาทเพื่อทำนายเส้นทางที่ดีที่สุดเนื่องจากอินพุตของพิกัดของเมือง

วิธีหนึ่งคือการใช้แบบจำลองลำดับ - ถึง - ลำดับ ลำดับอินพุตคือรายการของเมืองและลำดับเอาต์พุตเป็นลำดับที่ดีที่สุดในการเยี่ยมชมเมือง เครือข่ายประสาทได้รับการฝึกอบรมเกี่ยวกับอินสแตนซ์ TSP จำนวนมากและในระหว่างการฝึกอบรมมันเรียนรู้ที่จะแมปเมืองอินพุตเข้ากับเส้นทางที่ดีที่สุด

อีกวิธีหนึ่งคือการใช้กราฟประสาทเครือข่าย (GNN) เนื่องจาก TSP สามารถแสดงเป็นกราฟที่เมืองเป็นโหนดและระยะทางระหว่างพวกเขาคือขอบจึงสามารถใช้ GNNs เพื่อเรียนรู้โครงสร้างของกราฟและค้นหาเส้นทางที่ดีที่สุด GNNs มีประสิทธิภาพโดยเฉพาะอย่างยิ่งเพราะพวกเขาสามารถจับความสัมพันธ์ระหว่างเมืองต่าง ๆ ในกราฟ

การเรียนรู้เสริมแรง

การเรียนรู้การเสริมกำลังเป็นประเภทของการเรียนรู้ของเครื่องจักรที่ตัวแทนเรียนรู้ที่จะทำการตัดสินใจลำดับเพื่อเพิ่มรางวัลสะสมสูงสุด ในบริบทของ TSP ตัวแทนคือพนักงานขายการตัดสินใจเป็นคำสั่งที่จะเยี่ยมชมเมืองและรางวัลคือค่าลบของระยะทางทั้งหมดที่เดินทาง (ดังนั้นเป้าหมายคือการเพิ่มรางวัลสูงสุดซึ่งหมายถึงการลดระยะห่าง)

ตัวแทนเริ่มต้นด้วยนโยบายแบบสุ่มและโต้ตอบกับสภาพแวดล้อม (อินสแตนซ์ TSP) ในแต่ละขั้นตอนจะเลือกการกระทำ (เยี่ยมชมเมือง) และขึ้นอยู่กับสถานะที่เกิดขึ้น (ชุดใหม่ของเมืองที่ไม่ได้เข้าชมและตำแหน่งปัจจุบัน) จะได้รับรางวัล ตัวแทนจะอัปเดตนโยบายโดยใช้อัลกอริทึมเช่น Q - การเรียนรู้การเรียนรู้หรือการไล่ระดับสีเพื่อปรับปรุงประสิทธิภาพเมื่อเวลาผ่านไป

การใช้การเรียนรู้ของเครื่องจักรกับธุรกิจการจัดหา TSP

ในฐานะซัพพลายเออร์ TSP เราสามารถวาดหลายแนวระหว่าง TSP และการดำเนินธุรกิจของเรา ตัวอย่างเช่นเมื่อส่งมอบผลิตภัณฑ์ TSP ให้กับลูกค้าหลายรายเราประสบปัญหาการเพิ่มประสิทธิภาพที่คล้ายกันในการค้นหาเส้นทางการจัดส่งที่มีประสิทธิภาพมากที่สุด

ด้วยการใช้เทคนิคการเรียนรู้ของเครื่องเพื่อแก้ปัญหา TSP เราสามารถเพิ่มประสิทธิภาพเส้นทางการจัดส่งของเราลดต้นทุนการขนส่งและปรับปรุงความพึงพอใจของลูกค้า เราสามารถฝึกอบรมรูปแบบการเรียนรู้ของเครื่องเกี่ยวกับข้อมูลการจัดส่งในอดีตรวมถึงที่ตั้งของลูกค้าสภาพการจราจรและเวลาการส่งมอบ แบบจำลองสามารถทำนายเส้นทางการจัดส่งที่ดีที่สุดสำหรับชุดลูกค้าที่กำหนด

นอกจากนี้การเรียนรู้ของเครื่องยังสามารถใช้เพื่อเพิ่มประสิทธิภาพการจัดการสินค้าคงคลังของเรา เราสามารถใช้การวิเคราะห์เชิงพยากรณ์เพื่อคาดการณ์ความต้องการผลิตภัณฑ์ TSP ในสถานที่ต่าง ๆ และปรับระดับสินค้าคงคลังของเราตามนั้น สิ่งนี้สามารถช่วยเราลดต้นทุนสินค้าคงคลังและตรวจสอบให้แน่ใจว่าเรามีสต็อกเพียงพอที่จะตอบสนองความต้องการของลูกค้า

ผลิตภัณฑ์ TSP ของเรา

ที่ บริษัท ของเราเรานำเสนอผลิตภัณฑ์ TSP คุณภาพสูงที่หลากหลาย ตัวอย่างเช่นเรามีเนยผง SAPP การจัดเก็บระยะยาวคุ้มค่ามากซึ่งเหมาะสำหรับการจัดเก็บระยะยาวและมีคุณสมบัติการเก็บรักษาน้ำที่ยอดเยี่ยม เรายังให้ราคาที่ดีที่สุด TSP trisodium phosphate anhydrous 97% อาหารเกรด 7601 - 54 - 9ซึ่งเป็นผลิตภัณฑ์อาหารเกรดที่มีระดับความบริสุทธิ์สูง และของเรากรดโซเดียมไพโรฟอสเฟต CAS 7758 - 16 - 9 อาหารเกรดอาหาร SAPP NA2H2P2O7เป็นตัวเลือกยอดนิยมสำหรับการใช้งานอาหารต่างๆ

บทสรุป

การเรียนรู้ของเครื่องเป็นเครื่องมือที่มีประสิทธิภาพในการแก้ปัญหาพนักงานขายการเดินทางซึ่งมีผลกระทบต่อธุรกิจการจัดหา TSP ของเรา ด้วยการใช้ประโยชน์จากเทคนิคเหล่านี้เราสามารถเพิ่มประสิทธิภาพเส้นทางการจัดส่งของเราปรับปรุงการจัดการสินค้าคงคลังและเพิ่มประสิทธิภาพทางธุรกิจโดยรวมของเราในที่สุด

หากคุณมีความสนใจในผลิตภัณฑ์ TSP ของเราหรือต้องการหารือเกี่ยวกับวิธีที่เราสามารถเพิ่มประสิทธิภาพการดำเนินงานที่เกี่ยวข้องกับ TSP ของคุณได้โปรดติดต่อเราเพื่อรับการจัดซื้อและการอภิปรายเพิ่มเติม

การอ้างอิง

Applegate, DL, Bixby, RE, Chvátal, V. , & Cook, WJ (2006) ปัญหาพนักงานขายการเดินทาง: การศึกษาเชิงคำนวณ สำนักพิมพ์มหาวิทยาลัยพรินซ์ตัน
Goodfellow, I. , Bengio, Y. , & Courville, A. (2016) การเรียนรู้อย่างลึกซึ้ง กด MIT
Sutton, RS, & Barto, AG (2018) การเรียนรู้การเสริมแรง: บทนำ กด MIT