השקת ה-iphone למשל

פורסם ע"י בצלאל ב11 ביוני, 2008

רבבות גיקים, שוחרי טכנולוגיה ומשכימי אימוץ רצו לחזות במו עיניהם בצעצוע החדש של סטיב ג'ובס, רק שמספר המקומות באולם היה מוגבל והם נאלצו לחפש חלופות.

שמעתי וקראתי לא מעט אנשים שהתלוננו על כך שהיה קשה מאוד למצוא שידור סטרימינג מהאירוע שלא קרס תחת העומס, והיו כאלה שהרחיקו לכת וראו בכך כשלון של רשת האינטרנט.

אז נכון, האינטרנט (עדיין) לא בנויה כדי להעביר שידורי וידאו מחתרתיים בשידור חי להמונים. מצד שני, תזכירו לי איזה ערוץ טלוויזיה שידר את האירוע? אהא. וקולטים אותו בכבלים או בלווין? לולא האינטרנט לא היתה שום אפשרות לצפות באירוע הזה.

הטלוויזיה אמנם לא קורסת כשמיליונים צופים באותו שידור, אבל הטלוויזיה גם בנויה על מודל של רייטינג, לוחות שידורים ו"פריים-טיים". הטלוויזיה לא היתה משדרת את המסיבה של ג'ובס פשוט כי זה לא נראה לה משהו מעניין מספיק.

האינטרנט, ובמיוחד ה- web 2.0 לא עובדת ככה. האופי של האינטרנט מאפשר לתת ביטוי לכל נושא ולכל תחום, גם אם מספר האנשים שמתעניינים בו קטן באופן יחסי וגופי תקשורת גדולים לא רואים בו פוטנציאל רווח מספק או לא יודעים בכלל איך להתמודד איתו. השילוב של פלטפורמה זולה ונגישה עם אנשים שיוצרים תוכן גם כשהם לא יכולים ממש להתפרנס ממנו (כי הם רוצים להשתמש בו בעצמם, כי כיף להם, כי הם רוצים לתרום לקהילה או מכל סיבה אחרת), הוא מה שיוצר את הסקס-אפיל של web 2.0. בזכות זה האינטרנט יכול לאכלס למשל בלוגים מקומיים שמחליפים את המקומונים המיושנים (אין עניין בציבור), בלוגי ביקורת תקשורת שנכתבים אנונימית (אין עיתון אמיץ מספיק), אתרים שעוסקים באקולוגיה עירונית (בקרוב במקום "לרדת בגדול") או בלוגים מקצועיים על לינוקס וקוד פתוח (מתי יש שידור חוזר של זומביט).

צריך לזכור שלצד הקשיים של האינטרנט בצד הפיסי של כבלי תקשורת ופרוטוקולים (קשיים שצפויים להעלם עם הזמן), כבר היום יש תכנים שעצם קיומם ונגישותם אפשריים רק בזכות האינטרנט.

Technorati Tags: , , ,

למה ההרשמה כל כך מסורבלת?

פורסם ע"י בצלאל ב26 במאי, 2008

כל מי שמסתובב באינטרנט יותר מיומיים מכיר את הצורך להרשם לאתרים ושירותים ברשת - דואל, בלוג, רשת חברתית, פורום כזה, פורום אחר ואלף יישומי ווב 2.0.

דף הרישום בכל האתרים האלה דומה: שם משתמש, דואל, סיסמה, שאלת ביטחון, CAPTCHA, הסכם תנאי שימוש, אישור.

יש מקומות שמכבידים על הרישום בכוונה, כדי להבדיל בין משתמשים לגיטימיים (בני אדם) ולא לגיטימיים (בוטים, ספאמרים), ומוסיפים צורך באישור ההרשמה במייל או מנגנוני CAPTCHA למיניהם. זה דיי מציק, אבל אני יכול להבין למה עושים את זה.

אבל יש מקומות שההרשמה אליהם מסורבלת בלי שום הצדקה, וכוללת אחד או יותר מהאלמנטים הבאים:

1. סיסמה באורך של בין 6-8 תוים, המשלבת אותיות ומספרים (המהדרין דורשים שהתו הראשון יהיה אות). למה לעזאזל אני לא יכול לבחור את אחת הסיסמאות הסטנדרטיות שמשמשות אותי להרשמה לאתרים כמו שלכם? אם חשוב לכם שהסיסמאות יהיו חזקות, הציגו לי הודעה שמסבירה את החשיבות של סיסמה חזקה. הלאה הכפייה.

2. נא לספק שם, שם משפחה, כתובת פיזית, מיקוד ומספר טלפון בבית. אני חשבתי לתומי שאני נרשם לאתר עדכוני בלוגים, לא לשירות "ספאם כפי יכולתך". נא לדרוש רק את הפרטים שחיוניים לשימוש בשירות שלכם, ואם אני ארצה אולי אוסיף משהו.

3. לאחר שסיימת למלא את הטופס המייגע ולחצת "אישור" מסתבר ששם המשתמש שבחרת תפוס, ואז העמוד מתרענן לו וכל הפרטים שהכנסת נעלמים להם. העניין יכול לחזור על עצמו מספר פעמים עד שיימצא שם משתמש פנוי.

4. CAPTCHA בלתי מובן בעליל. כבר אמרתי שאני מבין את הצורך, אבל לפחות תביאו משהו שבני אדם יכולים לקרוא ולא אותיות מרוחות ומסתתרות שאי אפשר לפענח. גם כאן כמובן העמוד מתרענן עם כל טעות ושוכח את הפרטים שהוקלדו.

5. בונוס: דף רישום לא תקני. אחרי שסיימת למלא אותו מסתבר שכפתור "אישור" לא עובד בפיירפוקס.

Technorati Tags: , ,

האבולוציה של היוזר

פורסם ע"י בצלאל ב19 במרץ, 2008

ניב קלדרון כתב פוסט נהדר על התהליך האבולוציוני שעברנו כמשתמשי רשת, ובתוך כך על השינויים במנשק שלנו עם הרשת. בעקבות הפוסט של ניב (והתגובה שהשארתי שם), אני רוצה להתייחס למערכת היחסים הפרטית שלי עם הרשת.

השימוש שלי ברשת החל, כפי שסיפרתי ברשומת הפתיחה, כאשר קיבלתי את המודם הראשון שלי והתחלתי לבדוק מה אפשר לעשות איתו. ה-web היה אז בחיתוליו, והשימושים שלי ברשת הצטמצמו לדואל, Icq ו-IRC. מאוחר יותר הגיע הדפדפן הראשון שלי (NetManage Chameleon) והתחלתי גם בשוטטות עקרה ברשת. אבל עד אוקטובר 2001 לא ממש יצאתי מגבולות המחשב האישי שלי.
מה קרה באוקטובר 2001? שני דברים: הראשון הוא שרכשתי לפטופ, והשני הוא שהתחלתי את לימודי התואר הראשון במשפטים. כפי שקורה במקומות רבים, גם אצלנו התארגנה דיי מהר קבוצה של סטודנטים שהסכימו לחלוק ביניהם את נטל הלימודים, להעביר אחד לשני סיכומים של החומר, תרגומי מאמרים וכיוצא באלה. אלא שבניגוד למקרה הנפוץ, אנחנו ויתרנו על צילום מסמכים בעשרות עותקים, וגם שליחה קולקטיבית של כמויות חומר בדואל התגלתה כלא אפקטיבית, כאשר רוב התבות היו אז מאוד מוגבלות בנפח ונסתמו דיי מהר. הוחלט להעלות את כל החומר לאינטרנט. לצורך מטרה נעלה זו נבחר אתר yahoo briefcase, בו נולדו תיקיות נפרדות לכל קורס והחל למעשה עידן של שיתוף מידע בין הסטודנטים. המזוודות של יאהו שירתו את המטרה למשך זמן מסוים, ולאחר מכן עברנו לאתר וובי אמיתי - עולם המשפט.

נכון, האתר הזה חסר כמה מאפיינים שמאוד מזוהים עם עולם ה-web 2.0 כמו תיוג, הוספת תוכן עצמאית על ידי הגולשים ואינטראקציה בין הגולשים על גבי האתר, אבל הוא בפירוש היה החשיפה הראשונה שלי לעידן ה- web 2.0. אנחנו מדברים על קהילת משתמשים, בה כל אחד תורם פרטי מידע מתחום אחריותו, משתף את כל התכנים הללו ברשת באופן פתוח (לאורך כל הדרך האתר היה פתוח לגולשים מזדמנים ולא הוגבל בסיסמאות משום סוג) וללא כל אחריות על קיומו של המידע, טיבו או איכותו. אם מי מהחברים טרח לכתוב סיכום הכנה לבחינה אז היה אחד כזה באתר, אם לא אז לא, ובכל מקרה איש לא יכול היה לערוב לאיכות תוכנו של הסיכום. במרוצת הזמן פיתח האתר גם איזורים פונקצונאליים נוספים (רשימות טלפונים, לוחות זמנים, קישורים משפטיים ואפילו עמוד מיוחד למען עדכוני זמן אמת בנוגע למלחמת המפרץ השנייה) וגם צדדים חברתיים (ברכות ימי הולדת לחברי הצוות, תמונות של חתולים וכו').

בשלב מסוים שמתי לב שבכל הנוגע לחומר הלימודים אני פונה ישירות לאתר ולא למחשב האישי שלי. מכיוון שכמעט כל התוכן שאני ייצרתי היה משותף ברשת, נהניתי גם אני מעובדת היותו נגיש בכל מקום ומכל עמדת עבודה. ועדיין כאשר עבדתי על קובץ מסוים במחשב שאינו שלי, הייתי צריך לשלוח אותו לעצמי בדואל כדי שיהיה זמין מכל מקום.

השנים חלפו עברו, ולמעט גרסאות שונות של מערכות הפעלה, דפדפנים ומעבדי תמלילים, שום דבר מהותי לא השתנה.

אחרי שקניתי את הדומיין לבלוג שלי, מצאתי את עצמי מעביר אליו העתקים של מסמכים חשובים מהמחשב האישי. בהתחלה חשבתי שאני עושה את זה לשם הגיבוי, אבל מאוחר יותר הבנתי שהמשמעות היא רחבה יותר - אני רוצה את הקבצים שלי נגישים מכל מקום.
כיום, כל מחשב חדש שאני מגיע אליו יכול תוך דקות ספורות להפוך לתחנת עבודה זהה לחלוטין למחשב האישי שלי. הסימניות של השועל מסתנכרנות אוטומטית, הדואל שלי כבר מזמן שמור בשרת עלום של ג'ימייל אי שם באוקיאנוס השקט, והשם והסיסמה שלי מביאים את אנשי הקשר שלי למסנג'ר המקומי.
אבל עדיין, כשרציתי להראות לידידה משהו שכתבתי לפני כמה שנים, הסתבר שהוא שמור על הדיסק המקומי של המחשב האישי שלי בבית, ואין לי איך להגיע אליו.
להעלות את כל תוכן תיקיית המסמכים שלי לרשת ייקח שעות רבות (בגלל שקצב ההעלאה של חיבור האינטרנט שלי עדיין לא מספק), וגם אם אעשה זאת אצטרך להוריד את הקובץ למחשב המקומי כדי לפתוח או לערוך אותו, ואז לסנכרן חזרה.

דרך ארוכה, ולא מעט שינויים, עבר המנשק שלי עם הרשת. יש היום כמה פלטפורמות שמאוד מאוד מתקרבות לייצר אפשרות של עבודה בנגישות מלאה למידע שלי, מכל עמדה המחוברת לאינטרנט. אבל יש כאן (לפחות) שתי בעיות מרכזיות שאני לא רואה להן פיתרון באופק:
1. אבטחת מידע. אם אני כותב מסמך בעל תוכן רגיש על המחשב האישי, אני יכול לנתק את הכבל של המודם מהקיר ולדעת שהסיכוי שמישהו מצותת למחשב שלי הוא אפסי. בעבודה ישירות על הרשת אין לי אפשרות דומה, ואם יהיה ספק שיבטיח לי סביבת עבודה מאובטחת תמורת תשלום, תמיד נצטרך לסמוך על המילה שלו שהוא יודע מה הוא עושה.
2. קיומן של תוכנות מתאימות על הפלטפורמה המרוחקת. כאשר אני עובד על המחשב האישי אני יכול לקבוע אלו תוכנות יהיו מותקנות אליו. אחת האהובות עלי, למשל, היא תוכנת התרגום בבילון. היא לא מותקנת על כל מחשב ולא רצה על כל פלטפורמה. נניח שאני אוהב לכתוב את המסמכים שלי על מייקרוסופט וורד, ונניח שהפלטפורמה המרוחקת תציע לי גישה לעמוד עריכה של מייקרוסופט וורד (לא משנה המודל העסקי כרגע, מכיוון שכל זה עדיין תיאורטי), הרי דיי ברור שלא סביר שתהייה לי גישה לבבילון. גם לא לתוכנה החמודה שהופכת הקלדה מוטעית של אנגלית לעברית ולהיפך.

אז אין לי עדיין אפשרות אמיתית לעבוד ישירות על הקובץ ששמור על הרשת, ובכל מקרה עד שלא תהייה רשת זמינה על כל אינטש רבוע של הפלנטה, כנראה שאני אאלץ לסחוב את הלפטופ ו-DOK לכל מקום.

Technorati Tags: , , , , , , ,

מי משלם עבור מהפכת המידע?

פורסם ע"י בצלאל ב12 במרץ, 2008

אחד הביטויים הכי חמים בשטח, חם כמעט כמו "web 2.0″, הוא "מהפכת המידע" או "עידן המידע", והמהדרין מוסיפים "חברת המידע".

את התהוותה של מהפכת המידע נהוג ליחס לפריצת האינטרנט, ובמיוחד ה-web, לחיינו באמצע שנות ה-90′ של המאה הקודמת. קיומה של הרשת ונגישותה לציבור אפשרו לראשונה שיתוף מאסיבי של כלל הידע האנושי; החל מפרסומים אקדמיים רבי חשיבות, דרך עיתונות יומית, וכלה בבלוגים זבי חוטם.
אם בעבר חיפוש מידע סבל ממיעוט מקורות, העדר עדכון שוטף ועלויות גבוהות, כיום הבעיה היא עודף מידע וכן יכולת מוגבלת להעריך את מהימנותו. מיזמים רבים הוקמו, וכספי משקיעים רבים הוצאו, במטרה לשפר את היכולת לדלות מידע מהרשת ולספק לצרכני המידע כלים לברירת המידע הרלוונטי והערכת מהימנותו.

למעשה, מהפכת המידע החלה לפני זמן רב - עם המצאת הדפוס באמצע המאה ה-15. עד אז מצבור הידע האנושי היה אצור בכתבי יד נדירים ויקרים, אשר היו נגישים רק לאצולת הכנסיה. המצאת טכנולוגיות המחשוב, האחסון האלקטרוני והרשת הציבורית הן רק התפתחויות מאוחרות של אותה מהפכת מידע בת ארבע מאות שנה. נכון, היקף המידע הקיים גדל באופן חסר תקדים במאה השנה האחרונות, אבל ההתנהגות האנושית בהקשר אליו כמעט ולא השתנתה עד לאחרונה.

בעשור האחרון אנחנו עדים לתופעה מאוד מעניינת והרבה פחות מדוברת מאשר מהפכת המידע עצמה, אשר במסגרתה משתנה האופן שבו אנו צורכים שירותי מידע.

בתחילת דרכה של הרשת הציבורית, שירותי המידע שהיא הציעה התבססו על השיטה הרווחת ברוב השווקים האחרים: הצרכן המעוניין בשירות או במוצר משלם לספק או ליצרן ומקבל בתמורה את המוצר שחפץ בו. כך למשל, עד שלהי שנות ה-90 נהגו ספקיות שירותי המידע CompuServe ו- AOL לגבות תשלום קבוע מהמנויים תמורת הגישה לשרתים שלהן. באותה תקופה היו גם חברות ישראליות שניסו את השיטה הזאת, ביניהן TvTel (שירות שניסה לחקות את הצלחת ה- MiniTel הצרפתי ולהציע מעין פורטל קניות מקוון למנויים) וכמובן IOL זצ"ל. המודל הכלכלי של ספקי המידע היה מסורתי, ולא התאים לתנאים המתהווים ביקום האינטרנט.
כאשר צרכן נדרש לשלם מראש עבור הגישה למאגרי המידע ושירותי התוכן, אין לו למעשה יכולת לדעת האם מאחורי דרישת התשלום עומדת יכולת מוכחת לספק את המידע הדרוש. הפריצה הגדולה של האינטרנט להמונים טרם התרחשה, וציבור הצרכנים הפוטנציאלי היה ספקן בנוגע לנחיצותו של מנוי לשירותי מידע בחייו.

כך עברה הרשת למודל תשלום שהושאל מתעשיית הטלויזיה אך התפתח הרבה מעבר לאופי הראשוני שלו. לפי המודל הזה, צרכני התוכן אינם משלמים עבור המידע שהם צורכים; או שהמידע מוצע בחינם, או שהצרכן נדרש לצפות בנוסף לתוכן שביקש גם בתוכן שספק המידע בחר עבורו. זה יכול להיות תוכן פרסומי טהור (למשל כרזת פרסומת לאבקת כביסה), זה יכול להיות פרסום עצמי של ספק המידע (אם חיפשת מסוג X, דע לך שיש לנו גם מידע מסוג Y) ועוד. המכנה המשותף לכולן הוא שצד שלישי נושא בעלות העברת המידע מהיצרן לצרכן - זהו כמובן המפרסם.

למעשה, אותו "מפרסם" הוא בדרך כלל לא ישות אחת אלא אוסף של חברות פרסום אשר מייצגות, כל אחת, מספר מפרסמים, ומפיצות את התוכן הפרסומי שלהן באופן רוחבי ברשת. את אותו סט של פרסומות לאבקת כביסה, מכוניות, קופות גמל וקורנפלקס אני אפגוש גם באתר החדשות החביב עלי, גם בפרופיל של חברים ברשת החברתית שלי, גם בבלוגים של חברים שלי וגם במסגרת שירות הדואל-רשת החינמי שלי. עבור כל אחד מהשירותים האלה הייתי אמור, לו היינו משתמשים במודל המסורתי, לשלם בנפרד מכספי.

העובדה שבחברת המידע אנחנו רוכשים שירותים שמישהו אחר משלם עליהם הפכה למובנת מאליה, גם אם לא כל צרכני המידע מבינים אותה לעומקה. אנחנו משלמים על המידע שמעניין אותנו בקבלת מידע עודף שלא בהכרח מעניין אותנו, ובכך מעצימים את הבעיות בחיפוש המידע אותן הזכרתי בתחילת הרשומה.

אך מדוע שיטה זו לא  מתפשטת גם לשווקים אחרים? מדוע הספר שלי לא מעניק לי תספורת בתמורה לצפייה בפרסומות של ג'ל לשיער? מדוע חברת הטלפון לא מצליחה לקדם שירותים של שיחות טלפון בתמורה לפרסומות מתפרצות?
התשובה, לדעתי, נעוצה בעובדה שבעולם המידע הצרכן אינו יכול לדעת אם התמורה שיקבל עבור כספו תביא לו תועלת, ולפעמים הוא בכלל לא יודע מהי התמורה שיקבל. ביני לבין הספר שלי יש הסכם האומר שהוא יספר אותי לשביעות רצוני, אחרת הוא יוותר על התמורה או יבצע תיקון על חשבונו. ביני לבין חברת הטלפון יש הסכם האומר שכאשר אני מחייג מספר אקושר אל המנוי שהמספר שייך לו. נניח שפייסבוק היתה גובה תשלום חודשי, האם מישהו מעלה בדעתו שהיו מחזירים לו כסף לו לא היה מוצא חברים?

נניח שהמאמצים של מנועי חיפוש, סטארטאפים ושאר מיזמים ישאו פרי ויתנו בידנו כלים לדלות רק מידע רלוונטי ומהימן מתוך בליל המידע הקיים ברשת הציבורית, האם לאחר שהתרגלנו לצרוך מידע מבלי לשלם עליו יחזור הגלגל לאחור ומודל התשלום הקלאסי ישוב לשימוש?
הרי גם היום נשארו "איים" של ספקי מידע המציעים וודאות גבוהה מספיק שתמצא בהם את מה שאתה מחפש כדי להרשות לעצמם לגבות תשלום בכניסה, ואלו הם בעיקר ספקי מידע של מאמרים אקדמיים או אנציקלופדיות מקוונות כמו הבריטניקה ירום הודה.

מרכיב נוסף שעשוי להשפיע על התשובה לשאלה הזאת הוא ההתפתחות האבולוציונית שעבר מודל הפרסום הטלוויזיוני לאחר התאמתו לאינטרנט. אני מתכוון כמובן למרכיב התשלום ששמו "ויתור על הפרטיות".
כמעט כל אתר אינטרנט אוסף ושומר פריטי מידע על המשתמשים בו. אלה יכולים להיות פריטים סטטיסטיים סתמיים כמו סוג הדפדפן של המשתמש, אבל גם פרטים מהותיים יותר בנוגע להתנהגות המשתמש: מאיזה אתר הוא הגיע, לאיזה אתר הוא המשיך, מה המאפיינים הדמוגרפיים שלו ואילו פעולות הוא ביצע במסגרת האתר. כמעט כל אתר כולל עמוד של "הצהרת פרטיות", אבל מעטים המשתמשים שמבינים את משמעות תוכנו, מעטים המשתמשים שקוראים אותו  - וגם כשקוראים, הדבר הרי נעשה לאחר שכבר נכנסת לאתר והוא אסף עליך מידע.
איסוף זה של מידע על הצרכן הוא תשלום נוסף עבור מתן השירות - מעבר לצפייה בתוכן הפרסומי, ומי שמרוויח ממנו הוא לעיתים רחוקות הצרכן עצמו. מידע זה משמש את האתר, למשל, להצגת פרסומות מותאמות אישית ומאפשר לו לקבל תשלום כספי גבוה יותר מהמפרסם.

שוב ושוב עולה מילת המפתח "מידע". אנחנו צורכים מידע, משלמים במתן מידע על עצמנו ובקבלת מידע עודף על אחרים. מידע הפך לסחורה הכי חמה והשליטה במידע למקור הכוח הכי גדול. מסתבר שהאתגר של חברת המידע הוא לא רק להתמודד עם עודף המידע והערכת מהימנותו, אלא גם להתמודד עם חוסר הבקרה המוחלט על המידע שנמסר ומתקבל בידי המשתמשים.

האם תהיו מוכנים לשלם מכיסכם עבור סביבת מידע שבה אין פרסומות משום סוג ומובטח שלא נאסף עליכם כל פרט מידע? או שעבור הנגישות למידע אתם מוכנים להשלים עם אובדן הפרטיות והפיכתכם לפריטי מידע בעצמכם?

Technorati Tags: , , , , , , , , ,

תוכן לא טקסטואלי: עקב אכילס של מנועי חיפוש

פורסם ע"י בצלאל ב6 במרץ, 2008

מספר הדפים באינטרנט נאמד ב[הכנס מספר עצום ובלתי נתפס כאן], וחברות ענק עתירות ממון נאבקות (טוב, לא ממש. גוגל דיי עוקפת את כולם בסיבוב, אבל אנחנו בדיון אקדמי היום) על היכולת להכיר את מירב הדפים האלה ולשלוף מתוכם את התוכן הכי קרוב למה שהאדם המחפש התכוון אליו. אבל כל ענקי החיפוש עוסקים בעצם בעיקר בשיפור הדיוק של תוצאות החיפוש, ולא מתמודדים עם הצורך לשפר גם את המיצוי.

אסביר:

דיוק - איזה חלק של המידע המאוחזר הוא רלוונטי למחפש.
מיצוי - איזה חלק מהמידע הרלוונטי הקיים אוחזר במסגרת החיפוש.

כל מנועי החיפוש שאני מכיר יודעים לקרוא רק טקסט. גם כאשר מחפשים ומוצאים סוגים אחרים של מדיה (תמונות, פלאש, וידאו, סאונד) הדבר נעשה או באמצעות הצמדת תיאור טקסטואלי לפריט, למשל באמצעות תיוג, או על ידי התיחסות לטקסט המופיע בסביבת הפריט, למשל תוכן של כתבה בה משולבים וידאו ותמונה.

אם אחפש למשל "תמונה של ילד עם כובע", מנוע החיפוש לא יודע "לצפות" בתמונות, לנתח את הפרטים שמופיעים בהן, ולהחליט אם מדובר בילד או במבוגר, אם יש לו על הראש כובע או סתם ליפה, או אם מדובר בכלל בתמונת אילוסטרציה של חיזר עם אנטנה. אם מישהו צילם תמונה של ילד עם כובע אבל לא תייג אותה נכון (או בכלל), אין לי סיכוי להגיע אליה. אופן דומה, אם אני מחפש קטע מוקלט של הכרזת העצמאות, אין לי סיכוי למצוא אותו אלא אם הוא מופיע בתוך אייטם טקסטואלי שמדבר על הכרזת העצמאות, או שמי שהעלה את הקטע לרשת תייג אותו כראוי.
מנוע החיפוש גם יתקשה להחליט אם התמונה שהוא מוצא היא תמות אילוסטרציה, תמונת פפרצי, תמונה של צלב חובב, או תמונת יח"ץ רשמית.

פן נוסף של אותה בעיה הוא שמנוע החיפוש גם לא יודע לזהות "זהות" של פריטים. כלומר, אם אני מחפש למשל מידע על אדם מסוים במטרה ליצור איתו קשר, תוצאות החיפוש שיעזרו לי ביותר יהיו כנראה עמודי הפרופיל שלו ברשתות חברתיות שונות. אבל מנוע החיפוש לא יודע לזהות את העמודים האלה כ"עמודי פרופיל", אלא לכל היותר כעמודים שהשם המבוקש מופיע בכותרת שלהם. באותה מידה החיפוש יכול להחזיר תוצאות של כתבות בעיתונות שנעשו על האדם הזה, או אייטמים בבלוגים שהתיחסו אליו. שוב, זיהוי אופיו של הפריט נעשה רק בהתאם למידע הטקסטואלי שצורף אליו.

אני לא יודע אם היקף התוכן הלא טקטואלי מתקרב להיקף התוכן הטקסטואלי ברשת (יש לי תחושה שלא), אבל היכולת של מנועי החיפוש הקיימים לאחזר אותו מוגבלת ביותר.

מסקנות:
א. הקפידו לתייג את התוכן שלכם בקפידה.
ב. אם אני טועה אשמח לקבל קישור רלוונטי, ואם לא - אולי מישהו ירים את הכפפה ויפתח את הטכנולוגיה הזאת?

Technorati Tags: , , , ,

© כל הזכויות שמורות למפת סיביות
FireStats icon ‏מריץ FireStats‏