Explanation of overfitting. The MDL

Explanation of overfitting. The MDL theory gives an elegant explanation of why too rich representational schemes tend to overfit: When the encoding of the classifier itself is longer than the original data, or almost as long, then nothing is gained in terms of description length. E.g. You can represent K numbers as the values of a K-1 degree polynomial, but no description length is gained, since you now need K values for the coefficients of the polynomials. You can exactly fit a decision tree to data, if there is a separate leaf for each datum, but again no gain. You can cluster N points tightly into N clusters, one per point, but again no gain.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

คำอธิบายของ overfitting คำอธิบายห้องทำไมร่าง representational รวยเกินไปมักจะ overfit ให้ทฤษฎีอเนกประสงค์ MDL: เมื่อการเข้ารหัสของ classifier เองมีความยาวมากกว่าข้อมูลต้นฉบับ หรือเกือบยาว แล้วไม่มีอะไรจะรับในคำอธิบายยาว เช่น คุณสามารถแทนตัวเลข K เป็นค่าของตัว K-1 พหุนาม แต่ไม่อธิบายยาวเป็น ได้ เนื่องจากคุณเป็นค่า K สำหรับสัมประสิทธิ์ polynomials ขณะนี้ คุณสามารถใส่ต้นไม้ตัดสินใจข้อมูล ว่าถ้ามีใบแยกต่างหากสำหรับแต่ละวันที่โพส แต่อีกไม่กำไร คุณสามารถคลัสเตอร์ N จุดแน่นใน N คลัสเตอร์ หนึ่งต่อจุด แต่อีกไม่กำไร

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

คำอธิบายของ overfitting ทฤษฎี MDL ให้คำอธิบายว่าทำไมสง่างามของรูปแบบการดำเนินการที่อุดมไปด้วยมากเกินไปมีแนวโน้มที่จะ overfit: เมื่อการเข้ารหัสของลักษณนามของตัวเองมีความยาวมากกว่าข้อมูลเดิมหรือเกือบเป็นเวลานานแล้วไม่มีอะไรจะได้รับในแง่ของความยาวคำอธิบาย ตัวอย่างเช่นคุณสามารถแสดงตัวเลขเป็นค่า K ของ K-1 องศาพหุนาม แต่ระยะเวลาในคำอธิบายไม่ได้รับเนื่องจากคุณตอนนี้ต้องค่า K สำหรับค่าสัมประสิทธิ์ของพหุนาม คุณว่าสามารถใส่ต้นไม้ตัดสินใจข้อมูลถ้ามีใบแยกต่างหากสำหรับแต่ละตัวเลขอีกครั้ง แต่ไม่มีกำไร คุณสามารถจุดไม่มีกลุ่มแน่นเข้าไปในกลุ่ม N, ต่อหนึ่งจุดอีกครั้ง แต่ไม่มีกำไร

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

คำอธิบายของ overfitting . ทฤษฎีที่นักวิทยาศาสตร์ให้คำอธิบายที่หรูหราของทำไมรวยด้วยดำเนินการโครงการมีแนวโน้มที่จะ overfit : เมื่อเข้ารหัสของตัวเองนานกว่าข้อมูลเดิม หรือ เกือบจะนาน แล้ว ไม่มีอะไรที่ได้รับในแง่ของความยาวของรายละเอียด เช่นคุณสามารถเป็นตัวแทนของ K ตัวเลขเป็นค่าของพหุนามระดับขั้น K-1 แต่ไม่มีคำอธิบายยาวได้รับเนื่องจากขณะนี้คุณต้องการค่า K ของค่าสัมประสิทธิ์การพหุนาม . คุณสามารถจริงๆพอดีกับโครงสร้างการตัดสินใจข้อมูล ถ้ามีใบแยกต่างหากสำหรับแต่ละตัวเลข แต่อีกไม่ได้ คุณสามารถเข้าสู่กลุ่ม N จุดแน่น N กลุ่มละหนึ่งจุด แต่อีกไม่ได้

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.