לא תתפוס אותי כתב:
עד כה אף אחד לא הצליח לספק הסבר במה יעזור מאגר שהנתונים בו הפיכים.
זהו כמובן הדיון שצריך לקיים.
התשובה לשאלה מדוע מאכסנים את הנתונים עצמם, ולא איזשהו גיבוב (hash) שלהם היא שתהליך הזיהוי הוא לא מושלם ונותן תשובה האם טביעת אצבע אחת זהה לטביעת אצבע שניה, אלא נותן תשובה הסתברותית. במילים אחרות, לא רק טביעת האצבע שלי מתאימה לזו שעל הדרכון הביומטרי שלי. לאדם אחר יש סיכוי של p (שאותו קובע מי שמתכנן את המכשיר שמשווה את טביעות האצבע), כאשר ככל ש-p נבחר להיות קטן יותר, זה מגדיל את הסיכוי שגם אני לא אזוהה. היתרון על דרכון לא ביומטרי הוא ש-p ניתן לשליטה והוא הרבה יותר נמוך מאשר בדרכון רגיל. כאשר פקיד עייף ומשועמם צריך להשוות תמונה ישנה בגודל בול, הערך של p מתקרב מאד לאחד.
מכאן, אם היינו רוצים להשתמש בפונקציית גיבוב, היא צריכה להיות כזו ששומרת מרחק, כלומר שאפשר בעזרת לא רק לזהות אם טביעות אצבע הן זהות, אלא כמה הן דומות אחת לשניה. פונקציות כאלו קיימות ומאד שימושיות בהרבה מצבים, אך הן הפיכות בקלות על ידי brute force, לכן אין להן יתרון ממשי על שמירת הנתונים עצמם. יתרון נוסף של שמירת הנתונים עצמם הוא האפשרות הקלה יחסית של החלפת פונקציית ההשוואה.
עובדות אלו גם תוקעות מסמר נוסף בארון הקבורה של "ארגון טרור יזהה ישראלים", מכיוון שארגון טרור שישיג את מאגר המידע וינסה להשתמש בו כך, ימצא שכל אדם בעולם הוא ישראלי (או בדרך כלל כמה ישראלים).
באופן דומה, גם המשטרה המשווה טביעות אצבע שנמצאות בזירת פשע ל"כל הטביעות הידועות לה" משתמשת בהנחה שיש סיכוי גבוה שמי שביצע פשע נתון ביצע כבר פשעים אחרים בעבר. נכון לעכשיו, אם הם מוצאים טביעת אצבע בזירת רצח בתל אביב, משווים לכל טביעות האצבע של פושעים ידועים, ומוצאים שהיא מתאימה לנרקומן אילתי ולחבר ארגון פשע רמת גני, הרי יש להם חשוד אחד. אם ישוו לכל אזרחי המדינה, ויקבלו גם תינוק באר שבעי, אשת מחשבים חיפאית, וכו', זה לא באמת ישנה את החשודים.