ย้อนเวลากับหนึ่งในโครงการสวาปามในยุครัฐบาลอภิสิทธิ์ – แปลวิกิพีเดีย 10.7 ล้านบาท

ผมเคยเขียนวิจารณ์ไปแล้วครั้งนึงในหว้ากอ (แต่มันถูกย่อยสลายไปตามกาลเวลาแล้ว…. ) วันนี้ตามมาเก็บประเด็นตกค้างให้ครับ

ขอนำข่าวเดิมมารื้อฟื้นความทรงจำกันก่อน

นาย อภิสิทธิ์ เวชชาชีวะ นายกรัฐมนตรี กล่าวว่า รัฐบาลต้องการลดช่องว่างการเข้าถึงอินเทอร์เน็ตของประชาชน จึงประกาศนโยบายบรอดแบนด์แห่งชาติ ตั้งเป้าการพัฒนาโครงข่ายอินเทอร์เน็ตความเร็วสูงให้ครอบคลุมประชากรไม่ต่ำ กว่า 80% ในปี 2558 และไม่ต่ำกว่า 95% ในปี 2563 รัฐบาลจึงมอบหมายให้กระทรวงเทคโนโลยีสารสนเทศและการสื่อสาร (ไอซีที) เร่งรัดปฏิบัติตามนโยบายบรอดแบนด์แห่งชาติ ผ่านการดำเนินการของรัฐวิสาหกิจใต้สังกัด อาทิ อินเทอร์เน็ตความเร็วสูงราคาประหยัดสำหรับบ้านที่มีสายโทรศัพท์ ค่าบริการ 199 บาท/เดือน, บริการอินเทอร์เน็ตความเร็วสูงไร้สายเทคโนโลยีไวแมกซ์ ค่าบริการ 99 บาท/เดือน เป็นต้น

“การเข้าถึงคอมพิวเตอร์และอินเทอร์เน็ตบรอดแบนด์จะเป็นประโยชน์ในด้านการศึกษาสำหรับเด็กและเยาวชน เปิดพรมแดนใหม่ในการเรียนรู้ด้วยตนเองถือเป็นหัวใจสำคัญของปรัชญาการศึกษา ยุคใหม่ที่มุ่งเน้นการเรียนรู้ที่มีผู้เรียนเป็นศูนย์กลาง และการเรียนรู้ตลอดชีวิต”

ด้านนายจุติ ไกรฤกษ์ รัฐมนตรีว่าการกระทรวงไอซีที กล่าวว่า ทีโอทีเริ่มเปิดทดลองบริการอินเทอร์เน็ตความเร็วสูง 2 Mbps ราคา 199 บาท/เดือน ในหลายจังหวัด

ล่าสุดให้ บมจ.กสท โทรคมนาคมสนับสนุนโครงการแปลบทความภาษาอังกฤษบนสารานุกรมออนไลน์ “วิกิพีเดีย” เป็นภาษาไทย ใช้งบประมาณ 10.7 ล้านบาท ใน 1 ปี เพื่อขจัดอุปสรรคในการเข้าถึงแหล่งความรู้ของเยาวชน และให้สอดคล้องกับจำนวนผู้ใช้อินเทอร์เน็ตในไทยที่มีเพิ่มขึ้นต่อเนื่องทุก ปี โดยในปี 2553 มี 24 ล้านคน จากปี 2551 มี 10.96 ล้านคน และปี 2552 มี 18.3 ล้านคน

การสำรวจของบริษัทวิจัยต่างประเทศพบว่าทั่วโลกมีหน้า เว็บไซต์กว่า 4 พันล้านหน้า แต่มีหน้าเว็บภาษาไทย 3 ล้านหน้าเท่านั้น กว่า 90% เป็นภาษาอังกฤษ กับการแปลวิกิพีเดียเป็นภาษาไทย กสทฯ เป็นผู้สนับสนุนงบประมาณ โดยตั้งเป้าจะเพิ่มบทความในหน้าเว็บภาษาไทยให้เป็น 100 ล้านหน้าใน 18-24 เดือน ที่แปลวิกิพีเดียเพราะมีผู้ใช้งานมาก แม้จะมีภาษาไทยอยู่บ้าง แต่แค่ 63,000 บทความ หรือ 1.8% เท่านั้น

ก่อนหน้านั้น กระทรวงไอซีทีในสมัยรัฐมนตรีสิทธิชัย โภไคยอุดม เคยจัดสรรงบประมาณกว่า 500 ล้านบาทเพื่อแปลหนังสือมาแล้ว แต่ไม่ได้มีการสานต่อตนจึงได้เข้ามาดูแลโดยเปลี่ยนให้มาแปลสารานุกรมออนไลน์แทน เพราะมีผู้ใช้เยอะ และทำได้เร็วกว่าแปลหนังสือเป็นเล่ม เพราะต้องมีกระบวนการในการคัดเลือกหนังสือที่มีความเหมาะสม และติดต่อลิขสิทธิ์ เชื่อว่าจะดันบทความภาษาไทยให้มีมากเป็นอันดับ 2 ของภาษาท้องถิ่นบนโลกออนไลน์ได้รองจากภาษาเยอรมัน

หลังเปิดตัว โครงการในวันที่ 8 ม.ค.ที่ผ่านมาจะมีการแปลบทความภาษาอังกฤษจากสารานุกรมวิกิพีเดีย 30 ล้านบทความ ด้วยเทคโนโลยีที่เรียกว่า Statistical Machine Translation ซึ่งเป็นผลงานนักพัฒนาซอฟต์แวร์ และนักภาษาศาสตร์ชาวไทย ถือเป็นครั้งแรกในโลกที่มีการแปลสารานุกรมวิกิพีเดียจากภาษาอังกฤษทั้งหมด เป็นภาษาอื่นด้วยคอมพิวเตอร์ โดยเนื้อหาทั้งหมดของสารานุกรมออนไลน์จะอยู่บนเว็บไซต์ www.asiaonline.com

“เชื่อว่าโครงการนี้จะได้รับการสนับสนุนต่อเนื่อง โดยเฉพาะจากเอกชน หากมีผู้เข้าชมเว็บไซต์มาก โดยไอซีทีจะประเมินผลทุกไตรมาส แม้จะใช้ระบบแปลบทความให้ แต่บนเว็บยังมีฟังก์ชั่นที่เปิดให้ผู้เข้าชมเข้ามาช่วยขัดเกลาภาษาหรือช่วย แปลได้ เว็บมีทุนการศึกษาให้ผู้ที่เข้าร่วมกิจกรรมต่อเนื่องด้วย เชื่อว่าบทความที่แปลจะถูกต้องแม่นยำกว่า 95%”

ในครั้งนั้นผมได้แสดงจุดยืนชัดเจนว่า โครงการนี้ล้มเหลวอย่างสิ้นเชิง
แต่เนื่องด้วย มีบางคนทักท้วงว่า “ในเวปดังกล่าวอธิบายว่า ระบบที่ใช้แปลจะมีอัตราการเรียนรู้ ทำให้แปลได้ดีขึ้นเรื่อยๆ รวมถึงมีคนคอยตรวจทานแก้ไข
ซึ่งเนื้อหาอาจจะแปลไม่ถึงกับถูกเป๊ะๆ แต่พอจะเข้าใจได้บ้าง เดี๋ยวคนตรวจทานก็เรียบร้อย”

มีข้อเสนอเกิดขึ้นว่า เราให้เวลาสัก 6 เดือน แล้วกลับมาดูกันอีกรอบละกัน ตอนนี้ครบ 6 เดือนแล้วครับ มาดูประเด็นต่างๆ ตามนี้ครับ

1. เนื้อหาไม่สามารถนำมาใช้ประโยชน์ทางการศึกษาได้แน่นอน

ตัวอย่างครับ (ผมเลือกเฉพาะคณิตศาสตร์พื้นฐาน(ไม่เกินมัธยม)ที่ดูจะเป็นประโยชน์กับเยาวชนทุกคนมาให้ดูกันเล่นๆ)

http://th.asiaonline.com/article?article=Arithmetic_precision
http://th.asiaonline.com/article?article=Factorization
http://th.asiaonline.com/article?article=Composite_number
http://th.asiaonline.com/article?article=Summation
http://th.asiaonline.com/article?article=Rounding

จั่วหัวเอาไว้ว่า “บทความนี้แปลด้วยเครื่องแปลอัตโนมัติ แต่ยังไม่มีคนทำการตรวจแก้ภาษาของทั้งบทความหรือส่วนใดส่วนหนึ่งของบทความนี้” และไม่มีกำหนดการว่าจะแก้เมื่อไร

ดูคุณภาพแล้ว ไม่แน่ใจว่าแม่นยำ 95% หมายถึงอะไร
ได้ผลลัพธ์แบบนี้ถือว่าผ่านรึเปล่า ตรวจรับกันยังไง? แล้วเงินจ่ายไปแล้วรึยัง?
อ่านแล้วรู้สึกว่า translate.google ยังทำได้ดีกว่าอีกครับทั้งๆที่ฟรี (แน่นอนเพราะเป็น statistical เหมือนกันและคงทำไว้ดีกว่าด้วย รวมถึงมีปริมาณการเรียนรู้จากเวปไซต์เกือบทั้งโลกอีก)

2. โปรแกรมดังกล่าว-เนื้อหาที่ได้ เป็นสมบัติของใคร?

เจ้าของบริษัท-ผู้บริหารไม่มีคนไทยสักคน บริษัทดังกล่าวเป็นเจ้าของซอฟแวร์แปลภาษาอยู่แล้ว เนื้อหาที่ได้เอาไว้บนเวปของบริษัท(แถมยังมีโฆษณาอีก) ไม่เห็นประโยชน์ต่อวงการ software ของไทยเลย ด้านการศึกษาก็ลางเลือนไม่แพ้กัน

เปรียบเทียบกับการเอาไว้บน wiki ซึ่งมีสัญญาแน่นอนการันตีว่าเนื้อหานำไปใช้ประโยชน์ได้แน่ๆ และไม่ถูกยึดไปดื้อๆ ภายใต้ creative commons และ สัญญา copyleft (ผมเปล่าเล่นคำนา….เค้าตั้งกันมาแบบนี้จริงๆ)
http://en.wikipedia.org/wiki/Wikipedia:Text_of_Creative_Commons_Attribution-ShareAlike_3.0_Unported_License
http://en.wikipedia.org/wiki/Wikipedia:Copying_within_Wikipedia

สำหรับโครงการนี้คงได้แต่มองและจดจำ และอยากให้คนอื่นๆร่วมกันจำไว้ด้วยครับ เพื่อไม่ให้เกิดกรณีแบบนี้อีก

เงินภาษีตั้ง 10 ล้าน เอาไปจ้างนักศึกษาที่เรียนด้านภาษา อาจจะแปลได้ไม่ถึง แสนบทความ แต่ก็มีค่ากว่า ขยะออนไลน์ที่ทำประโยชน์อะไรไม่ได้เลยแน่นอนครับ

เว็บนี้มันไร้ประโยชน์ทางการศึกษามานานแล้วครับ  ภาษาที่แปลออกมาแทบจะทุกบทความมันก็คือ “ซับนรก” ดีๆนี่เอง  ผมยังคิดไม่ออกเลยว่าคนที่ผ่านมาอ่านจะได่รับความรู้อะไรกลับไป

(ขอยกตัวอย่างง่ายๆจากที่เคยเห็นผ่านตามานะครับ)

– “3rd Assault Amphibian Battalion”(กองพันจู่โจมสะเทิ้นน้ำสะเทิ้นบกที่3)  แปลเป็น  “กองพันสัตว์สะเทิ้นน้ำสะเทิ้นบกที่3”

– “US Army’s 10th Mountain Division” (กองพลภูผาที่10แห่งกองทัพสหรัฐฯ)  แปลเป็น  “กองทัพเรา 10 ส่วนภูเขา”

– “Bravo Company, 3rd Battalion”(กองร้อยบราโว่ สังกัดกองพันที่3)  แปลเป็น “บริษัทไชโย3กองพัน”

ป.ล. ดูแล้วมันก็แค่การก๊อปข้อมูลใน “วิกิพีเดีย” มาทั้งดุ้น  แล้วจับแปลด้วยโปรแกรมอัตโนมัตินี่เอง -*-

ที่มา : ยังมีใครจำข่าวโครงการแปล wiki เป็นภาษาไทย 10.7 ล้านบาท ได้มั๊ยครับ

Posted on: 14/07/2012, by : webmaster
%d bloggers like this: