ในฐานะซัพพลายเออร์ TSP (Trisodium Phosphate) ฉันได้เห็นภูมิทัศน์ที่พัฒนาขึ้นของอุตสาหกรรมและความต้องการที่เพิ่มขึ้นสำหรับการแก้ปัญหาที่มีประสิทธิภาพ ปัญหาพนักงานขายการเดินทาง (TSP) ในขณะที่ดูเหมือนจะไม่เกี่ยวข้องอย่างรวดเร็วครั้งแรกแบ่งปันพื้นฐานร่วมกับธุรกิจของเราในแง่ของการเพิ่มประสิทธิภาพและประสิทธิภาพ ในบล็อกนี้ฉันจะสำรวจว่าการเรียนรู้ของเครื่องสามารถใช้ในการแก้ปัญหา TSP ได้อย่างไรและแนวคิดเหล่านี้สามารถนำไปใช้กับธุรกิจการจัดหา TSP ของเราได้อย่างไร


การทำความเข้าใจปัญหาพนักงานขายที่เดินทาง
ปัญหาพนักงานขายการเดินทางเป็นปัญหาการเพิ่มประสิทธิภาพ combinatorial ที่รู้จักกันดี เป้าหมายคือการหาเส้นทางที่สั้นที่สุดที่พนักงานขายสามารถใช้ในการเยี่ยมชมชุดเมืองหนึ่งครั้งและกลับไปที่จุดเริ่มต้น ในทางคณิตศาสตร์ได้รับชุดของ (N) เมืองและระยะทางระหว่างแต่ละเมืองแต่ละคู่ปัญหาคือการหาการเปลี่ยนแปลงของเมือง (n) ที่ลดระยะทางทั้งหมดที่เดินทาง
ความซับซ้อนของ TSP เติบโตอย่างทวีคูณด้วยจำนวนเมือง สำหรับ (N) เมืองมีเส้นทาง ((n - 1)!/2) เส้นทางที่เป็นไปได้ เมื่อ (n) เพิ่มขึ้นจำนวนของการแก้ปัญหาที่เป็นไปได้จะกลายเป็นดาราศาสตร์ ตัวอย่างเช่นสำหรับ 10 เมืองมีเส้นทางที่เป็นไปได้ 181440 เส้นทางและสำหรับ 20 เมืองมีเส้นทางที่เป็นไปได้ประมาณ (6 \ times10^{16}) สิ่งนี้ทำให้ยากมากที่จะหาวิธีแก้ปัญหาที่ดีที่สุดโดยใช้วิธีการเดรัจฉาน - แรง
วิธีการดั้งเดิมในการแก้ปัญหา TSP
ก่อนการกำเนิดของการเรียนรู้ของเครื่องมีวิธีการดั้งเดิมหลายวิธีในการแก้ปัญหา TSP:
- Brute - Force Search: ดังที่ได้กล่าวไว้ก่อนหน้านี้วิธีนี้เกี่ยวข้องกับการตรวจสอบทุกเส้นทางที่เป็นไปได้และเลือกเส้นทางที่มีระยะทางที่สั้นที่สุด ในขณะที่รับประกันการแก้ปัญหาที่ดีที่สุด แต่ก็เป็นไปไม่ได้ที่คำนวณได้สำหรับเมืองจำนวนมาก
- อัลกอริทึมฮิวริสติก: เหล่านี้เป็นอัลกอริทึมที่หาวิธีแก้ปัญหาที่ดีได้อย่างรวดเร็ว แต่ไม่รับประกันการแก้ปัญหาที่ดีที่สุด ตัวอย่างรวมถึงอัลกอริทึมเพื่อนบ้านที่ใกล้ที่สุดซึ่งพนักงานขายมักจะไปเยี่ยมชมเมืองที่ไม่ได้เข้าชมที่ใกล้ที่สุดเสมอและอัลกอริทึม 2 - OPT ซึ่งปรับปรุงเส้นทางที่กำหนดโดยการสลับขอบคู่
- การเขียนโปรแกรมแบบไดนามิก: วิธีการนี้แบ่งปัญหาออกเป็นปัญหาย่อยที่เล็กลงและแก้ปัญหาซ้ำ ๆ อย่างไรก็ตามมันยังมีความซับซ้อนเวลาสูงและ จำกัด อยู่ที่ขนาดปัญหาที่ค่อนข้างเล็ก
วิธีการเรียนรู้ของเครื่องเพื่อแก้ปัญหา TSP
การเรียนรู้ของเครื่องนำเสนอวิธีใหม่และทรงพลังในการจัดการกับ TSP นี่คือเทคนิคการเรียนรู้ของเครื่องที่ใช้กันทั่วไปที่ใช้:
เครือข่ายประสาท
เครือข่ายประสาทโดยเฉพาะอย่างยิ่งเครือข่ายประสาท (RNNs) และตัวแปรของพวกเขาเช่นเครือข่ายหน่วยความจำระยะสั้นระยะยาว (LSTMS) ถูกนำมาใช้เพื่อแก้ปัญหา TSP แนวคิดพื้นฐานคือการฝึกอบรมเครือข่ายประสาทเพื่อทำนายเส้นทางที่ดีที่สุดเนื่องจากอินพุตของพิกัดของเมือง
วิธีหนึ่งคือการใช้แบบจำลองลำดับ - ถึง - ลำดับ ลำดับอินพุตคือรายการของเมืองและลำดับเอาต์พุตเป็นลำดับที่ดีที่สุดในการเยี่ยมชมเมือง เครือข่ายประสาทได้รับการฝึกอบรมเกี่ยวกับอินสแตนซ์ TSP จำนวนมากและในระหว่างการฝึกอบรมมันเรียนรู้ที่จะแมปเมืองอินพุตเข้ากับเส้นทางที่ดีที่สุด
อีกวิธีหนึ่งคือการใช้กราฟประสาทเครือข่าย (GNN) เนื่องจาก TSP สามารถแสดงเป็นกราฟที่เมืองเป็นโหนดและระยะทางระหว่างพวกเขาคือขอบจึงสามารถใช้ GNNs เพื่อเรียนรู้โครงสร้างของกราฟและค้นหาเส้นทางที่ดีที่สุด GNNs มีประสิทธิภาพโดยเฉพาะอย่างยิ่งเพราะพวกเขาสามารถจับความสัมพันธ์ระหว่างเมืองต่าง ๆ ในกราฟ
การเรียนรู้เสริมแรง
การเรียนรู้การเสริมกำลังเป็นประเภทของการเรียนรู้ของเครื่องจักรที่ตัวแทนเรียนรู้ที่จะทำการตัดสินใจลำดับเพื่อเพิ่มรางวัลสะสมสูงสุด ในบริบทของ TSP ตัวแทนคือพนักงานขายการตัดสินใจเป็นคำสั่งที่จะเยี่ยมชมเมืองและรางวัลคือค่าลบของระยะทางทั้งหมดที่เดินทาง (ดังนั้นเป้าหมายคือการเพิ่มรางวัลสูงสุดซึ่งหมายถึงการลดระยะห่าง)
ตัวแทนเริ่มต้นด้วยนโยบายแบบสุ่มและโต้ตอบกับสภาพแวดล้อม (อินสแตนซ์ TSP) ในแต่ละขั้นตอนจะเลือกการกระทำ (เยี่ยมชมเมือง) และขึ้นอยู่กับสถานะที่เกิดขึ้น (ชุดใหม่ของเมืองที่ไม่ได้เข้าชมและตำแหน่งปัจจุบัน) จะได้รับรางวัล ตัวแทนจะอัปเดตนโยบายโดยใช้อัลกอริทึมเช่น Q - การเรียนรู้การเรียนรู้หรือการไล่ระดับสีเพื่อปรับปรุงประสิทธิภาพเมื่อเวลาผ่านไป
การใช้การเรียนรู้ของเครื่องจักรกับธุรกิจการจัดหา TSP
ในฐานะซัพพลายเออร์ TSP เราสามารถวาดหลายแนวระหว่าง TSP และการดำเนินธุรกิจของเรา ตัวอย่างเช่นเมื่อส่งมอบผลิตภัณฑ์ TSP ให้กับลูกค้าหลายรายเราประสบปัญหาการเพิ่มประสิทธิภาพที่คล้ายกันในการค้นหาเส้นทางการจัดส่งที่มีประสิทธิภาพมากที่สุด
ด้วยการใช้เทคนิคการเรียนรู้ของเครื่องเพื่อแก้ปัญหา TSP เราสามารถเพิ่มประสิทธิภาพเส้นทางการจัดส่งของเราลดต้นทุนการขนส่งและปรับปรุงความพึงพอใจของลูกค้า เราสามารถฝึกอบรมรูปแบบการเรียนรู้ของเครื่องเกี่ยวกับข้อมูลการจัดส่งในอดีตรวมถึงที่ตั้งของลูกค้าสภาพการจราจรและเวลาการส่งมอบ แบบจำลองสามารถทำนายเส้นทางการจัดส่งที่ดีที่สุดสำหรับชุดลูกค้าที่กำหนด
นอกจากนี้การเรียนรู้ของเครื่องยังสามารถใช้เพื่อเพิ่มประสิทธิภาพการจัดการสินค้าคงคลังของเรา เราสามารถใช้การวิเคราะห์เชิงพยากรณ์เพื่อคาดการณ์ความต้องการผลิตภัณฑ์ TSP ในสถานที่ต่าง ๆ และปรับระดับสินค้าคงคลังของเราตามนั้น สิ่งนี้สามารถช่วยเราลดต้นทุนสินค้าคงคลังและตรวจสอบให้แน่ใจว่าเรามีสต็อกเพียงพอที่จะตอบสนองความต้องการของลูกค้า
ผลิตภัณฑ์ TSP ของเรา
ที่ บริษัท ของเราเรานำเสนอผลิตภัณฑ์ TSP คุณภาพสูงที่หลากหลาย ตัวอย่างเช่นเรามีเนยผง SAPP การจัดเก็บระยะยาวคุ้มค่ามากซึ่งเหมาะสำหรับการจัดเก็บระยะยาวและมีคุณสมบัติการเก็บรักษาน้ำที่ยอดเยี่ยม เรายังให้ราคาที่ดีที่สุด TSP trisodium phosphate anhydrous 97% อาหารเกรด 7601 - 54 - 9ซึ่งเป็นผลิตภัณฑ์อาหารเกรดที่มีระดับความบริสุทธิ์สูง และของเรากรดโซเดียมไพโรฟอสเฟต CAS 7758 - 16 - 9 อาหารเกรดอาหาร SAPP NA2H2P2O7เป็นตัวเลือกยอดนิยมสำหรับการใช้งานอาหารต่างๆ
บทสรุป
การเรียนรู้ของเครื่องเป็นเครื่องมือที่มีประสิทธิภาพในการแก้ปัญหาพนักงานขายการเดินทางซึ่งมีผลกระทบต่อธุรกิจการจัดหา TSP ของเรา ด้วยการใช้ประโยชน์จากเทคนิคเหล่านี้เราสามารถเพิ่มประสิทธิภาพเส้นทางการจัดส่งของเราปรับปรุงการจัดการสินค้าคงคลังและเพิ่มประสิทธิภาพทางธุรกิจโดยรวมของเราในที่สุด
หากคุณมีความสนใจในผลิตภัณฑ์ TSP ของเราหรือต้องการหารือเกี่ยวกับวิธีที่เราสามารถเพิ่มประสิทธิภาพการดำเนินงานที่เกี่ยวข้องกับ TSP ของคุณได้โปรดติดต่อเราเพื่อรับการจัดซื้อและการอภิปรายเพิ่มเติม
การอ้างอิง
- Applegate, DL, Bixby, RE, Chvátal, V. , & Cook, WJ (2006) ปัญหาพนักงานขายการเดินทาง: การศึกษาเชิงคำนวณ สำนักพิมพ์มหาวิทยาลัยพรินซ์ตัน
- Goodfellow, I. , Bengio, Y. , & Courville, A. (2016) การเรียนรู้อย่างลึกซึ้ง กด MIT
- Sutton, RS, & Barto, AG (2018) การเรียนรู้การเสริมแรง: บทนำ กด MIT
