ข้ามไปเนื้อหา

เพจแรงก์

จากวิกิพีเดีย สารานุกรมเสรี
ตัวอย่างเพจแรงก์สำหรับเครือข่ายอย่างง่าย (ค่าจาก 100) แสดงถึง หน้า B มีค่าเพจแรงก์สูงสุด เพราะมีจำนวนหน้าที่ลิงก์เข้าหามากสุด แต่ทว่า หน้า C มีเพจแรงก์สูงกว่าหน้า E แม้ว่าจะมีหน้าที่ลิงก์มาหน้าน้อยกว่า แต่หน้าที่มีน้ำหนักลิงก์เข้าหาหน้า C

เพจแรงก์ (อังกฤษ: PageRank) คือขั้นตอนวิธีที่ใช้การวิเคราะห์เว็บลิงก์ตามทฤษฎีเครือข่ายที่ใช้เป็นพื้นฐานในตัวเสิร์ชเอนจินของกูเกิล โดยเพจแรงก์จะแสดงเป็นค่าตัวเลขบ่งบอกถึงความความสำคัญของข้อมูลในกลุ่มของชุดข้อมูล ตัวเลขของเพจแรงก์ของกูเกิลในปัจจุบันจะมีค่าระหว่าง 0 ถึง 10 (ถูกคำนวณค่าในลักษณะลอการิทึม) แสดงถึงความสำคัญของหน้านั้นบนตัวค้นหาของกูเกิล หน้าที่มีเพจแรงก์สูงจะปรากฏขึ้นมาก่อนหน้าที่มีเพจแรงก์ต่ำ ค่าของเพจแรงก์ถูกคำนวณจากจำนวนการอ้างถึงจากหน้าอื่น และน้ำหนักของหน้าที่ลิงก์เข้ามาหา

ประวัติ

[แก้]

เพจแรงก์ถูกพัฒนาขึ้นที่มหาวิทยาลัยสแตนฟอร์ด โดย แลร์รี เพจ (และเป็นที่มาของชื่อ เพจแรงก์ (ความหมายเป็นนัยว่า อันดับของเพจ)) โดยเริ่มต้นเมื่อปี พ.ศ. 2538 และต่อมา เซอร์เกย์ บริน นักศึกษามหาวิทยาลัยเดียวกันได้เข้ามาร่วมงานวิจัยนี้ ร่วมกันพัฒนาและได้ร่วมก่อตั้งบริษัทกูเกิล ในปี 2541

เพจแรงก์ได้มีการพัฒนาภายใต้ทฎษฎีการวิเคราะห์การอ้างถึงข้อมูลของ (Eugene Garfield) จากมหาวิทยาลัยเพนซิลเวเนีย ซึ่งชื่อของยูจีนได้มีการอ้างถึงในต้นฉบับของวิทยานิพนธ์นั้น

"PageRank" เป็นเครื่องหมายการค้าของกูเกิลซึ่งได้ถูกจดสิทธิบัตร (U.S. Patent 6,285,999) โดยมหาวิทยาลัยสแตนฟอร์ด ซึ่งทางบริษัทกูเกิลได้นำมาใช้แลกเปลี่ยนกับจำนวนหุ้นกับทางมหาวิทยาลัยในจำนวนเงินเทียบเท่า 1.8 ล้านหุ้น ซึ่งราคา 336 ล้านดอลลาร์สหรัฐ[1][2]

ขั้นตอนวิธี

[แก้]

เพจแรงก์เป็นการแจกแจงความน่าจะเป็นที่เป็นค่าเฉลี่ยของการใช้งานเว็บไซต์โดยสุ่มค่าความน่าจะเป็นระหว่าง 0 ถึง 1 โดยค่า 0.5 เป็นค่าโอกาส 50% ที่โอกาสจะเกิดขึ้น

ตัวอย่างขั้นตอนวิธี

[แก้]
การทำงานของเพจแรงก์

จำลองค่าเว็บเพจสี่หน้า A B C และ D ค่าเริ่มต้นของเพจแรงก์ในแต่ละหน้าจะมีค่าเท่ากันคือ 0.25 ซึ่งรวมทั้งหมดจะมีค่าเท่ากับ 1

ถ้าหน้า B C และ D ลิงก์ไปยังหน้า A จะเป็นการให้คะแนน 0.25 เพจแรงก์ต่อหน้า A ซึ่งค่าเพจแรงก์ เขียนว่า PR( ) ในระบบจะกลายเป็น

ซึ่งมีค่าเป็น 0.75

และถ้าหน้า B ยังคงลิงก์ไปยังหน้า C ขณะที่หน้า D ลิงก์ไปยังทุกหน้า ทำให้คะแนนจากหน้า B ถูกแบ่งออกสำหรับ A และ C เหลือเพียง 0.125 ขณะที่คะแนนจาก D จะเหลือให้แต่ละหน้าเป็นหนึ่งในสาม (ประมาณ 0.083)

ซึ่งสามารถเขียนเป็นสมการได้ว่า เพจแรงก์ที่ให้คะแนนต่อหน้าอื่นนับตามลิงก์ที่ชี้ไปยังหน้าอื่น L( ) มีค่าเท่ากับคะแนนเพจแรงก์ของหน้านั้นหารด้วยจำนวนลิงก์ที่ชี้ออกไป

และสมการในลักษณะทั่วไปสำหรับหน้าใดๆ คือ

ข้อเสนอ "rel='nofollow'" ของกูเกิล

[แก้]

ในต้นปี 2548 กูเกิลได้มีข้อเสนอให้เพิ่มเติมค่าของ "" ในส่วนของ rel เพื่อให้นักพัฒนาเว็บไซต์สามารถเลือกได้ว่าจะนำลิงก์ในส่วนนั้นมาร่วมในระบบให้คะแนนของเพจแรงก์หรือไม่ ซึ่งใช้สำหรับป้องกันปัญหาสแปมและ ตัวอย่างเช่นการสแปมโดยการโฆษณาเว็บไซต์ตัวเองตาม[3] ซึ่งถ้าแอดมินของเว็บนั้นใส่ค่า "rel='nofollow'" ไว้ในส่วนเนื้อหา จะทำให้เว็บไซต์นั้นไม่ถูกนำมาคำนวณค่าเพจแรงก์

อ้างอิง

[แก้]
  1. PEECHA Khunphonaiam. Krieger (1 December 2005). "Stanford Earns $336 Million Off Google Stock". San Jose Mercury News, cited by redOrbit. สืบค้นเมื่อ 2009-02-25.
  2. Richard Brandt. "Starting Up. How Google got its groove". Stanford magazine. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2009-03-10. สืบค้นเมื่อ 2009-02-25.
  3. อ้างอิงผิดพลาด: ป้ายระบุ <ref> ไม่ถูกต้อง ไม่มีการกำหนดข้อความสำหรับอ้างอิงชื่อ :0