יותר

כתובות גיאוגרפיות ברמות דיוק דיווחים שונות?


אני מנסה לקודד גיאוגרפי למסד נתונים שיש לו, אקרא לו "4 שכבות", של סוגי כתובות.

הם:

  • רחוב ממוספר (למשל 506 Taproom Way)
  • קרוס-סטריט (Happy Road $ Jubilant Blvd)
  • מאות בלוק (רחוב חמוציות 500 בלוק)
  • כביש (שדרות העצמאות)

הוספתי שדה המסווג כל שכבה.

מערך הנתונים המדובר הוא מקור קהל (ולכן, קצת מבולגן) שאסף מקרים בהם אדם מת מאינטראקציה עם אכיפת החוק (שימוש במשטרה בכוח קטלני). אם כן, הייתי משווה את הנתונים האלה לנתונים מסוג פשע, אך מנקודת מבט הפוכה. אני מאמת את מערך הנתונים ומבצע ניתוח נקודות חמות. לכן אני רוצה לקודד את הכתובות (באמצעות ArcMap 10.2).

בשתי השכבות הראשונות תהיה שגיאת מיקום מקובלת, אך לשתי הרמות האחרות (מאות חסימות וכביש) תהיה שגיאה גדולה יותר. לניתוח סוג פשע איזה סוג של טעות מיקום מקובל? האם יש דרך להתמודד עם השכבות הפחות מדויקות? האם עדיף לשנות את הנקודות למצולעים (בלוקים) או לקו פולילינים (כבישים) המייצגים את האירוע?


  • רשומות הרחוב הממוספרות הן סטנדרטיות ולא מהוות בעיה בהנחה שניתן למצוא התאמה בנתוני הקוד/הגיאוגרפי. בהתאם לשירות, הדיוק צריך להיות גבוה מאוד. חלקם מבוססים על מיקומי נקודה או חבילה בפועל. אחרים פשוט משתמשים באורך האחוז של הקו ובטווח עבור קו זה כדי לקבוע היכן לאורך הקו לשים את הנקודה.
  • חוצות רחובות ניתנות לטיפול גם על ידי קודנים רבים, אך יש לך סיבוכים נוספים. ראשית, מדובר ברחוב חוצה ולא בכתובת, כך שאולי הוא אינו מייצג נקודה ממשית או שאינך יודע לאיזו פינה הוא שייך. שנית, אותם רחובות יכולים להצטלב יותר מפעם אחת, כך שבסופו של דבר יהיו לך אפשרויות רבות ואין דרך להחליט ללא מידע נוסף.
  • בלוקים הופכים לבעייתיים, כי עכשיו אין לך בכלל נקודה ספציפית. מהערתי לשאלה זו, שונתה כך שתתאים לדוגמא שלך: אינך יכול פשוט להשתמש במספר החסימה מכיוון ש- 500 Cranberry St היא כתובת - הנקודה הראשונה בגוש 500 של הכביש ההוא. יתכן שזו לא כתובת למשלוח דיוור, כיוון שמספרי בתים מתחילים ב -510. אז בעצם יש שתי בעיות שעליך להחליט לגבי גישה אליהן. ראשית, אם יש לך מספר כתובות בגוש 500, אין דרך להפריד ביניהן והן יקבלו את אותה הנקודה. שנית, לקידוד הגיאוגרפי יש טווח כתובות לכל קטע רחוב. זה יכול להיות דפוס כמו 500-599, ותוכל להשתמש ב- 550 כדי להדביק אותו באמצע (או להשתמש במספר טווח התחלה או סיום כדי לשים אותו בקצה זה או אחר). בכל מקרה, הנקודה לא תהיה במיקום האמיתי. עד כמה הוא מדויק (תלוי) בכמה זמן הבלוק הוא.
  • רק עם כביש, אין כמעט טעם. רק במקרים בהם הכביש הוא רק קטע באורך בלוק אחד כמו שביל דרך או משהו כזה תוכל להשיג כל סוג של התאמה אמינה. אחרת הנקודה עלולה ליפול בכל מקום לאורך הכביש, כמה שהיא תהיה לאורך העיר. במקרה הטוב הקידומות או הסיומות עשויות לחסל את חצי הדרך (כלומר דרום לעומת עצמאות צפון). בדומה לבלוקים, ניתן להציב נקודה בתחילת, באמצע או בסוף וזהו בערך.

אני לא לגמרי בטוח למה אתה מתכוון ב'שגיאה יחסית לכל נדבך '. אם אתה מתכוון למצוא התאמה בכלל עם שירות הקידוד הגיאוגרפי, זה דבר אחד. אם אתה מתכוון בין הנקודה הגיאוגרפית ל מַמָשִׁי נקודה, יהיה עליך לקבל נקודות בפועל להשוות אליהן ורק השכבה הראשונה שלך נותנת את אלה, אלא אם רק קבלת אותה בצומת הנכון או הגוש הנכון מספיקה כדי לקרוא לזה מדויק. תצטרך מקור אחר מהקוד הגיאוגרפי להשוות מול, כמו מפת כתובות ותמונות או משהו. או שתהיה UPS, שידועה לאסוף נקודות GPS ממש על סף הכתובת בזמן המסירה.

ההצעה הראשונה שלי תהיה לפצל את מסד הנתונים או לכל הפחות להוסיף שדה חדש שמסמן את סוג הכתובת ולהתמקד בקידוד גיאוגרפי של כל סוג בנפרד. אתה יכול גם (בהתאם לשירות) להשתמש באיתור מורכב - כלומר הוא משתמש קודם כל באיתור רחובות, לא מוצא התאמה ומנסה לאתר חוצות, לא מוצא התאמה ומנסה בכל שיטה שתחליט לטפל בלוקים וכו '. לספק מידע נוסף אודות איזו תוכנה או שירות אתה משתמש עשויים להוביל לטכניקות או צעדים ספציפיים יותר לטיפול בשכבות הבעיות.


כריס וו נמצא על הפרק, במיוחד בשתי הנקודות האחרונות. מאה בלוקים הם בעלי ערך מוגבל ושם רחוב ללא מספר בכלל שימושי רק אם יש רק רחוב אחד או שניים לרחוב. כפי שציין, התייחס לכל "מחלקה" בנפרד, אם כי סביר להניח כי ניתן להפעיל את שני הראשונים ביחד בהתאם לסגנון האיתור. למשל, איתור בסגנון רחובות בארה"ב (Esri-speak) יכול לטפל בנתונים מסוג #או ברחוב #1 @ street #2. לחיים.