سفارش تبلیغ
صبا ویژن

پروژه گوگل

The Anatomy of a Large-Scale Hypertextual Web Search Engine

در این صحفه، با گوگل کنونی با نمونه اولیه از یک ماشین جستجوگر بزرگ شاخص می باشد که این یک ساختار بزرگ می سازد که در متن ترکیبی کنونی به کار برده می شود.

گوگل  یک طرح  برای عمل  و فهرست نمودن وب به طور مؤثر ارائه دادن نتیجه متقاعد کننده بیشتر جستجو نسبت به سیستم های موجود می باشد.

نمونه اولیه همراه با متن تمام و پیوند دادن 24 میلیون صفحه می باشد پایگاه داده قابل دسترسی در http:\\google\standford.edu می باشد.

مهندس ماشین جستجو یک تکلیف چالش انگیز می باشد.

ماشین جستجو  ده ها و صد ها و میلیون ها صفحه های وب نظیر تعدادی از دوره های مشخص و مجهز و واضح را فهرست می کند.

آنها هر روز به ده ها ، میلیون ها از جستجو ها پاسخ می دهند.

با اینکه اهمیت اعتبار ماشین جستجوی بزرگ شاخص در وب تحقیقات علمی خیلی کوچکتری درباره آنها بوده است.

از این گذشته ناشی از پیشرفت سریع تکنولوژی و ازدیاد تکثیر وب می باشد. ایجاد شدن ماشین جستجوی وب امروزی که خیلی متفاوت از 3 سال گذشته است.

این صحفه توصیفاتی از ماشین جستجو را آماده می کند. وب مان – اول این قبیل توصیفات پر جزئیات عمومی که بنا بر زمان می دانیم.

بخش یک مسأله از یک مقیاس گذاری استاندارد فنون جستجو بنابر عناصر داده ها بوسیله این مقدار ، اینجا وجود دارد. چالش تخصصی جدید گرفتار شدنی همراه با بکارگیری اطلاعات اضافی کنونی مافوق متن برای ارائه دادن بهترنتیجه جستجو می باشد.

در این صفحه آدرس ها این سؤالات درباره اینکه سیستم بزرگ واقعی کارآزموده که می تواند از اطلاعات اضافی کنونی در مافوق متن بهره برداری کرد چطور ساخته می شود.

همچنین ما نگاه می کنیم به مسأله ای در باره اینکه چطور مقداری به طور مؤثر همراه با جمع آوری مافوق متن کنترل نشدنی در جایی که هر کس هر چیزی را که آنها می خواهند می تواند چاپ کند.

کلید واژه: شبکه جهانی اطلاعات ، ماشین های جستجو ، بازیابی اطلاعات ، رده بندی صفحه.

  1.Introduction

وب چالش جدیدی برای بازیابی اطلاعات بوجود می آورد.

مقداری از اطلاعات درون وب سریع رشد می کنند به طوریکه بهتر از کاربرهای جدید با تجربه در هنر جستجوی وب می باشند.

مردم محتمل هستند برای به کارگیری وب عملی که آن رسم لینک می باشد. اغلب با نگهداری کردن بالای انسانی ، با بریدن به قطعات کوچک همانند یاهو یا همراه با ماشین های جستجو گر می باشد.

لیست گرفتن سرپوش عمومی پشتیبانی انسانی مبحث مؤثری می باشد اما فاعلی هستند و البته گران برای ساخته شدن و نگهداری کردن آسان برای اصلاح کردن . و نمی توان همه مبحث های محرمانه را پوشش داد.

ماشین های جستجوی خودکار برای آنکه به همسان سازی کلید واژه اعتماد کنند معمولاً به همتا های کیفیت پایین خیلی مراجعه می کنند.

برای درست کردن ماده بد تر، تعدادی اعلان کنندگان به خاطر سود بردن مردم کوشش می کنند بوسیله اندازه گرفتن متوسط برای به اشتباه انداختن ماشین های جستجوگر خودکار.

ما ساختمان یک ماشین جستجوی بزرگ را داریم که دارای آدرس بسیاری از مسأله های موجود سیستم است.

آن بویژه استفاده زیاد از ساختار های اضافی کنونی در مافوق متن برای فراهم آوردن کیفیت بالای نتیجه جستجو را بوجود می آورد.

ما اسم سیستم مان را گوگل انتخاب می کنیم زیرا آن یک هجی عمومی از googol می باشد و خوبی اول هدفمان ساختمان بسیار بزرگ ماشین های جستجو گر می باشد.

تکنولوژی ماشین جستجو باید مقیاس گذاری چشمگیری خوب نگه داشتن همراه با پیشرفت و رشد در جهت وب را داشته باشد.

در سال 1994 یکی از ماشین های جستجوی صفحه وب، شبکه ارتباطی جهانی چند بازاریاب( wwww ) دارای فهرستی از 110000 صفحه وب و اسناد وب قابل دسترسی داشت.

به طوریکه در نوامبر 1997 ماشین های جستجوی بالا ادعا می کردند فهرستی از 2 میلیون تا 100 میلیون اسناد وب را دارا می باشند.

آن در سال 2000 قابل پیش بینی بود که می تواند فهرست وسیعی از وب را که دارای بیش از یک میلیارد اسناد را داشته باشد را دارا باشد.

...   

<<<بیشتر مقالات سایت که اعضا به آن دستیابی پیدا می کنند با ذکر منبع می باشند.>>>

 

دان لود کامل

   توجه: برای دریافت رمز مقالات باید به عضویت دهکده خاله فر درآمده باشید.


نوشته شده در  پنج شنبه 88/1/20ساعت  11:11 عصر  توسط علی رحمانی 
  نظرات دیگران()


لیست کل یادداشت های این وبلاگ
با سلام
[عناوین آرشیوشده]