- הוסף לסימניות
- #1
ענקית החיפוש גוגל, הכריזה ביום שישי על השלמת מערכת האינדוקס המדוברת, "קפאין". עשרה חדשים אחרי שהשמועות אודותיה התחילו לרחוש ברחבי האינטרנט, עכשיו היא מוכנה לפעולה כשהיא מבטיחה תוצאות עדכניות יותר ב50% מהגירסה הקודמת.
קצת רקע למי שלא לגמרי מבין איך חיפוש במנועי חיפוש עובד:
כשאנחנו מחפשים בגוגל, אנחנו לא מבצעים חיפוש בין דפי אינטרנט "חיים", כלומר החיפוש לא נערך על רשת האינטרנט עמצה בזמן אמת. אלא בעצם, אנחנו מחפשים באינדקס השמור של גוגל. לגוגל יש מעין עותק שמור של "כל האינטרנט", וכשאנחנו מחפשים ביטוי מסויים, עורכים מחשבי גוגל חיפוש מהיר ברחבי האינדקס שלהם, ומציגים בפנינו את התוצאות הרלבנטיות ביותר לאותו ביטוי. (הנה סרטון שמסביר את זה)
נוכח כמויות התוכן ברשת שהולכות וגדלות בקצב מטריד, ובמקביל, לנוכח השינו שחל באופיים של דפי האינטרנט היום, שמלאים בתכני וידאו, תמונות ותכנים המתעדכנים בזמן אמת, התעורר הצורך והרעיון ליצירת מערכת אינדוקס חדשה שתתמודד באופן יעיל יותר עם המשימה וייתנו מענה טוב יותר לציפיות של המשתמשים במנועי חיפוש היום.
המבנה של מערכת האינדוקס הקודמת, היה אסופה של מספר שכבות, שהשכבה המרכזית שבהם, התעדכנה ונסרקה מחדש בערך פעם בשבועיים. מערכת קפאין לעומת זאת, מעדכנת על בסיס קבוע את כל שכבות האינדקס, ובכך מאפשרת למשתמשים לקבל תוכן טרי יותר בכל זמן נתון.
אם ניכנס רגע למספרים, לקפאין יכולת עיבוד של מאות אלפי עמודים במקביל בכל שניה. הקיבולת של קפאין היא אדירה, כמויות המידע הנאספות בכל יום עשויות להגיע לקצב מהמם של מאות אלפי גיגהבייטים ביום, והמערכת מסוגלת להכיל עד מאה מליון גיגהבייט במסד נתונים יחיד.
דבר אחד בטוח, החיפוש של גוגל הולך להפוך למהיר יותר ומדוייק יותר.
אתם עלולים שלא להבחין בהכרח בשינוי, מאחר וגם המערכת הקודמת היתה טובה למדי, אבל בהחלט סביר להניח שבפעם הבאה שתשתמשו בגוגל, תמצאו תוכן עדכני יותר ורלבנטי יותר.
קצת רקע למי שלא לגמרי מבין איך חיפוש במנועי חיפוש עובד:
כשאנחנו מחפשים בגוגל, אנחנו לא מבצעים חיפוש בין דפי אינטרנט "חיים", כלומר החיפוש לא נערך על רשת האינטרנט עמצה בזמן אמת. אלא בעצם, אנחנו מחפשים באינדקס השמור של גוגל. לגוגל יש מעין עותק שמור של "כל האינטרנט", וכשאנחנו מחפשים ביטוי מסויים, עורכים מחשבי גוגל חיפוש מהיר ברחבי האינדקס שלהם, ומציגים בפנינו את התוצאות הרלבנטיות ביותר לאותו ביטוי. (הנה סרטון שמסביר את זה)
נוכח כמויות התוכן ברשת שהולכות וגדלות בקצב מטריד, ובמקביל, לנוכח השינו שחל באופיים של דפי האינטרנט היום, שמלאים בתכני וידאו, תמונות ותכנים המתעדכנים בזמן אמת, התעורר הצורך והרעיון ליצירת מערכת אינדוקס חדשה שתתמודד באופן יעיל יותר עם המשימה וייתנו מענה טוב יותר לציפיות של המשתמשים במנועי חיפוש היום.
המבנה של מערכת האינדוקס הקודמת, היה אסופה של מספר שכבות, שהשכבה המרכזית שבהם, התעדכנה ונסרקה מחדש בערך פעם בשבועיים. מערכת קפאין לעומת זאת, מעדכנת על בסיס קבוע את כל שכבות האינדקס, ובכך מאפשרת למשתמשים לקבל תוכן טרי יותר בכל זמן נתון.
אם ניכנס רגע למספרים, לקפאין יכולת עיבוד של מאות אלפי עמודים במקביל בכל שניה. הקיבולת של קפאין היא אדירה, כמויות המידע הנאספות בכל יום עשויות להגיע לקצב מהמם של מאות אלפי גיגהבייטים ביום, והמערכת מסוגלת להכיל עד מאה מליון גיגהבייט במסד נתונים יחיד.
דבר אחד בטוח, החיפוש של גוגל הולך להפוך למהיר יותר ומדוייק יותר.
אתם עלולים שלא להבחין בהכרח בשינוי, מאחר וגם המערכת הקודמת היתה טובה למדי, אבל בהחלט סביר להניח שבפעם הבאה שתשתמשו בגוגל, תמצאו תוכן עדכני יותר ורלבנטי יותר.
הנושאים החמים