تحقیقات باریابی و پژوهشهای اجتماعی- مدیریت و پردازش داده ها


7. مدیریت و پردازش داده‏ها

7-1. کلیات

مجری پژوهش باید رویه‏های مستند بجایی داشته باشد تا نشان دهد ورود داده‏ها، کدگذاری، ویرایش، تهیه فایل و ارائۀ جداول مطابق الزامات این مواد قانونی، انجام شده است. شواهدی باید وجود داشته باشند که این استاندارد اجرا شده است.

7-2. ورود داده‏ها به صورت الکترونیکی

مجری پژوهش باید مطمئن شود که ورود داده‏ها یا مشخصات ضبط شده برای پروژه‏های مصاحبه‏های تلفنی به کمک رایانه و مصاحبه‏های شخصی به کمک رایانه (CAPI،CATI) مانند پروژه‏های آنلاین مشخص و دقیق می‏باشد.

مجری پژوهش باید روش‏هایی را برای آزمایش طراحی و اجرای فرم‏های الکترونیکی پرسشنامه‏ها، نگهداری کنند. نوع آزمایشات و مشخصات افراد در ارتباط با آزمایشات می‏بایست مستند گردد.

متن الکترونیکی تأیید پذیرش کارفرما (موردی که به وسیلۀ کارفرما توافق شده است) باید مستند شده باشد. در صورتی‏که مصاحبه در چند مکان انجام گیرد، قویاً پیشنهاد می‏گردد که تنها در یک نقطه پرسشنامه توزیع شود، و مورد آزمون و اصلاح قرار گیرد. تغییرات انجام شده می‏بایست مستند گردند و کنترل نسخه می‏بایست انجام گردد.

یادداشت: بخش 5.4.1 برای طراحی پرسشنامه را ببینید.

7-3. ورود داده‏ها به نسخۀ چاپی

7-3-1. مشخصات

هرگاه از ورود منطقی داده بهره برده شود، کنترل‏های درونی باید پیش از آغاز ورود داده‏ها مورد آزمون قرار گیرد و مستند شود. ماهیت آزمون‏های استفاده شده و نتایج بدست آمده از آن‏ها باید مستند شده باشد. داده‏های ورودی غیرقابل حل (که به علت کنترل‏های درونی پذیرفته نشده‏اند) باید به مدیر/سرپرست پروژه به همراه یک نسخه از تغییرات صورت گرفته برای اخذ تصمیم یا حل مسأله اطلاع داده شوند.

البته غیر از موارد مشخصی که ورود داده ساده است، داده برای ثبت در پرسشنامه باید کلیدگذاری شود.

رکورد هر دستورالعملی باید در یک فایل نگهداری شود.

7-3-2. تصدیق ورود داده‏ها برای مستندات کاغذی

یک روش نظام‏مند تایید حداقل درصدی از کار ورود داده باید روی یک پروژه یا قسمتی از آن انجام شود. در مورد ورود منطقی داده، حداقل بررسی درصد کل هر پروژه 5 درصد از ورودی‏ها می‏باشد و برای ورود ساده داده باید 10 درصد از ورودی‏ها تایید شوند. رویه‏ها باید وجود یک روش نظام‏مند تایید کار هر شخص را تضمین کنند و این تایید باید به وسیلۀ یک شخص دوم انجام شود.

اگر کار یک شخص شامل خطاهای مکرر باشد، کار آن شخص در پروژه باید به طور کامل مورد بازبینی قرار گیرد. در صورت نیاز، آن شخص باید تحت آموزش مجدد قرار گیرد تا نرخ خطا به میزان قابل قبولی برسد. اثربخشی آموزش مجدد باید بررسی و مستند شود.

مجری پژوهش باید خطاهای مکرر را تعریف و آن تعریف را مستند نماید.

7-4. صحت پایگاه‏های داده ای که به ورود داده نیاز ندارند

مجری پژوهش باید فرایندهای تعریف شده مناسبی داشته باشد تا از صحت مجموع داده‏های که توسط ابزارهایی غیر از ورود داده نسخۀ چاپی به وجود آمده‏اند، اطمینان حاصل کند.

این ممکن است شامل (و نه محدود به) داده‏های ایجاد شده در موارد زیر باشد:

  • اسکن کردن (تصویر دیجیتالی از اطلاعات گرفتن)
  • گردآوری داده‏های الکترونیکی (مانند پیمایش‏های تشخیص صدا، تحقیقات آنلاین، تحقیقات مبتنی بر وب)
  • پایگاه‏های داده مصاحبه به کمک رایانه
  • پایگاه‏های داده ای که توسط ورود یا ادغام داده از یک منبع یا برنامه به منبع یا برنامه ای دیگر ایجاد می‏گردند.

فرایند خودکار ورود داده (مانند اسکن) باید در هر پروژه یا مرحله‏ای از آن مورد بازبینی قرار گیرد. مجری پژوهش باید روش‏های اجرایی به منظور آزمایش طراحی و اجرای فرایند خودکار ورود داده‏ها، ایجاد و نگهداری نماید. انواع آزمون‏های به کار برده شده و مشخصات کارکنان مرتبط، باید مستند شوند.

اگر از رویه‏های اسکن بهره برده می‏شود، باید نرخ موارد عدم قبول و جایگزین شده برآورد شود. رویه‏های مدیریت داده‏های رد شده باید مستند شوند.

همچنین باید رویه‏های مناسب برای مدیریت نرخ جایگزینی‏های غیر قبول وجود داشته باشد.

7-5. کدگذاری

7-5-1. کلیات:

اگر از نرم افزار کدگذاری خودکار استفاده می‏شود، نرخ خطا باید برآورد شود. اگر نرخ خطا غیر قابل قبول باشد، فرهنگ داده‏ها (لغت نامه داده‏ها) باید بازنگری شود.

7-5-2. تهیه کدنامه

مجری پژوهش باید مطمئن شود که کدگذارها که بر روی پروژه کار می‏کنند دستور العمل‏هایی را در اختیار دارند که حداقل شامل موارد زیر است:

  • خلاصه‏ای از کلیت پروژه.
  • تعیین سؤال‏ها یا متغیرهایی که باید کدگذاری شوند.
  • حداقل نسبت یا تعداد نمونه (و ساختار آن) که برای تهیه کدنامه استفاده می‏شود.
  • هرگاه نیاز باشد، زیر گروه‏های خاص برای تهیه کدنامه اختصاص یابند (به عنوان مثال بر اساس منطقه، کاربر یا غیر کاربر)
  • هرگاه مورد نیاز یا مناسب باشد راهنمای گنجاندن کدها در کدنامه
  • هر گونه استفاده‏ای از کدنامه‏های پروژه‏های پیشین یا مراحل قبلی
  • هر گونه الزامات یا دستورالعمل‏های خاص مختص پروژه مدیر پروژه باید کدنامه را قبل از شروع کدگذاری تائید و مستند نماید. این تائیدیه ممکن است شامل شبکه‏بندی، مخفف‏گذاری (کوتاه‏سازی)، به زبان دیگر بیان کردن، کدگذاری مجدد و پاک کردن کدها باشد. کدگذار/کدگذاران باید برای استفاده از کدنامه آموزش ببینند به عنوان مثال، باید از تصمیمات و قوانین که چه کدهایی باید شامل شوند و یا حذف شوند، آگاه شوند. بعد از تایید کدنامه، هرگاه کدهای بیشتری در طی فرآیند کدگذاری مورد نیاز و مناسب تشخیص داده شدند، تمام نسخه‏های کدنامه باید به روز شوند و هر پرسشنامه‏ای که پیشتر کدگذاری شده است، باید مطابق با کدهای جدید اصلاح شود.مجری پژوهش باید قوانین و دستورالعمل‏های شفافی برای چگونگی کدگذاری پاسخ‏های سایر و همۀ گزینه‏ها داشته باشد. اگر طبقه‏بندی‏های سایر و همۀ گزینه‏ها از 10% پاسخ‏هایی که باید کدگذاری شوند بیشتر شد، پاسخ‏ها باید با نگاه کوچک سازی اندازه گروه بازبینی شوند.7-5-7. باز بینی اگر کار یک کدگذار شامل خطای فراوان باشد، کار آن کدگذار (در پروژه) باید100% بازبینی شود و یا از نو انجام شود. اگر نیاز باشد باید آموزش مجدد مناسب به کدگذار داده شده تا نرخ خطاها قابل قبول گردد. اثربخشی آموزش مجدد باید بررسی و مستند شود. 7-6-1. ویرایش کردن داده‏هازمانی‏که ویرایش اجباری استفاده شده است، منطق این اجبار باید مستند شود و اجرای آزمایشی صورت گیرد، و نتایج آن مستند شود تا نشان دهد که این اجبار نتیجه مطلوب داده است.7-6-2. مقدمات ورود دادهوقتی این نوع از ویرایش استفاده می‏شود، باید منطق و قوانینی که به کار برده می‏شود مستند شده و کارکنانی که بر روی این بخش طرح کار می‏کنند باید نسبت به انواع کنترل‏ها و تصحیحاتی که ممکن است انجام دهند، توجیه شوند.7-7. مدیریت فایل داده‏ها
  • ملاحظاتی در مدیریت فایل‏ها باید صورت گیرد تا از موارد زیر اطمینان حاصل گردد:
  • هرگاه اسناد کاغذی پیش از ورود داده‏ها با دست ویرایش شده باشد، باید امکان تمایز میان پاسخ‏های اصلی پاسخ‏دهندگان یا مصاحبه‏کنندگان از کدها یا پاسخ‏هایی که توسط فرد یا افرادی که ویرایش را انجام می‏دهند، وجود داشته باشد.
  • سابقه دقیق هر تغییر اعمال شده در مجموعه داده‏های اولیه باید نگهداری شود. هیچ داده‏ای نباید بدون آگاهی و تائید مدیر پروژه جایگزین شود. اولین گام در این فرآیند باید مقایسه با منبع اولیه داده‏ها باشد. تمام فرآیندهای جایگزین باید مستند شوند و در صورت درخواست در دسترس کارفرما باشند. تمام مشخصات ویرایش باید مستند شود.
  • 7-6. ویرایش داده‏ها
  • مجری می بایست خطاهای مکرر را تعریف و آن را مستند کند.
  • یادداشت: دو رویکرد اصلی به باز بینی وجود دارد: مستقل و وابسته. باز بینی وابسته به این معنی است که بازبین دوم به کدگذاری اصلی دسترسی دارد. باز بینی مستقل به این معنی است که بازبین دوم به کدگذاری اصلی دسترسی ندارد. در بازبینی مستقل، کدگذاری اولیه و کدگذاری‏های بازبینی مقایسه می‏شوند و اگر متفاوت از هم بودند، کد صحیح توسط یک فرآیند داوری انتخاب می‏شود. در بازبینی‏های مستقل خطاهای بیشتری نسبت به بازبینی‏های وابسته شناسایی می‏شود.
  • مجری پژوهش باید رویه‏های تعریف شده‏ای برای بازبینی کدگذاری هر پروژه داشته باشد. رویه‏ها باید وجود یک روش نظام‏مند برای بررسی حداقل %5 پرسشنامه‏های کدگذاری شده در هر پروژه را تضمین کنند و همچنین بازبینی باید توسط شخص دیگری (بازبین) انجام شود.
  • 7-5-6. سایر طبقه بندی‏ها
  • 7-5-5. به روز رسانی
  • یادداشت: به دلیل این‏که کدگذاری پاسخ‏های باز اغلب وابسته به قضاوت شخص هستند، آموزش مناسب ضروری می‏باشد.
  • 7-5-4. آموزش کدگذاری
  • در جایی که پاسخ “نمی‏دانم” و “بدون پاسخ” داده شده، این‏ها باید از یکدیگر تمیز داده شوند.
  • 7-5-3. تائیدیه کدنامه
  • یادداشت: برای برخی متغیرها، مجری پژوهش می‏تواند از استانداردهای مصوب موجود برای طبقه بندی مواردی همچون صنعت، شغل و تحصیل استفاده کند.
  • رکوردها درون فایل‏ها تکراری نباشند
  • آخرین نسخه استفاده شده باشد.
  • مجموعه داده‏های اصلی پالایش شده به درستی قابل شناسایی باشند.
  • قبل و بعد از ویرایش داده‏ها، باید فراوانی‏ها و سایر آماره‏ها محاسبه شوند تا امکان مقایسه فراهم شود.

یادداشت: کیفیت رویه‏های وزن دهی را در 1.5.5 ببینید.

7-8. تحلیل داده‏ها

7-8-1. مشخصات تحلیل داده

تحلیلگر/محقق باید تحلیل داده‏ها را مطابق با مشخصات ارائه شده توسط مدیر پروژه/مسئول اجرایی پروژه انجام دهد.

7-8-2. سوابق تحلیل

مجری پژوهش باید سوابق توصیفی و دقیق فرآیند تحلیل را نگه دارد، تا اطمینان یابد از اینکه هر تحلیل انجام شده می تواند در آینده تکرار شود.

7-8-3. بازبینی تحلیل داده‏ها

مجری پژوهش باید رویه‏ها را به کار برد تا اطمینان یابد که جدول بندی‏ها و سایر خروجی‏ها بازبینی شده‏اند.

در این بازبینی باید حداقل موارد زیر بررسی شود:

  • کامل بودن. یعنی تمامی جداول همان گونه که مشخص شده وجود دارند.
  • مخفف سازی برای عناوین یا پاسخ‏های باز به صورت صحیح منعکس کننده تمام محتوا باشد.
  • پایه هر جدول در مقابل دیگر جداول یا فراوانی‏ها صحیح باشد.
  • نقاط توقف استاندارد در برابر سؤالات منبع بازبینی شده‏اند.
  • تمامی اقلام داده‏های حاصل شده بر اساس منابع آن‏ها بازبینی شده‏اند.
  • نمودارها برای زیر گروه‏ها و شبکه‏ها درست هستند.
  • هیچ جدول پر نشده‏ای وجود ندارد (یعنی بدون داده)
  • وزن دهی ( بوسیله جداول تست)
  • شمارش فراوانی‏ها قبل از جدول‏گیری، تا اطمینان از دقت داده و تعیین اندازه‏های پایه برای زیرگروه‏ها بدست آید.
  • املاء درست و خوانا بودن
  • هر تحلیل آماری استفاده شده مناسب و صحیح است.
  • برای خروجی‏های بعدی، کنترل‏های مناسب باید به کار گرفته شود.7-8-4. جداول داده
  • وقتی داده‏ها به کارفرما گزارش می‏شوند، مثلاً در یک نسخه چاپی یا دیجیتال از جداول، به تناسب باید موارد زیر در نظر گرفته شوند.
  • ارجاع به منبع واقعی سؤال که داده‏ها برای آن است.
  • شامل توصیف هر روش وزن‏دهی به کار برده شده برای داده
  • شناسایی واضح هر زیرگروهی که استفاده می‏شود.
  • درج پایه محاسبه برای هر سؤال، تا تعداد پاسخ‏دهندگانی که واقعاً به سؤالات جواب دادند شناسایی شوند
  • تعداد افرادی که پاسخ “نمی‏دانم” دادند و پاسخ ندادند.
  • درج پایه های داده وزن داده شده و وزن داده نشده
  • تعریف و توضیح کامل و دقیق از متغیرهایی که در تحلیل داده‏ها استفاده می‏شوند که شامل هر آزمون معنی داری، شاخص گذاری، امتیازدهی و محاسبه میانگین، میانه، مد، و انحراف معیار
  • آزمون‏های آماری
  • اطلاعات روی خنثی کردن سلول و دیگر تمهیدات به منظور اطمینان از رازداری
  • اخطار بر روی نتایجی که در اثر وجود حجم نمونه کوچک، غیر قابل اطمینان هستنداگر داده مستقیماً به شکل الکترونیکی به کارفرما منتقل شود، موارد زیر باید قبل از انتقال داده‏ها بررسی شود:
  • 7-9. انتقال داده الکترونیکی
  • سازگاری شکل داده‏ها با مشخصات نرم افزاری که با کارفرما توافق شده است.
  • کامل بودن (یعنی تعداد صحیح فایل‏ها و پرونده‏ها در هر فایل باشد)
  • در صورت لزوم، گنجاندن مشخصات ساختاری داده‏ها
  • در صورت لزوم، برچسب زدن به محتویات فایل‏ها و گنجاندن دستورالعمل روی محدودیت‏های استفاده
  • در صورت درخواست، رمزگذاری فایل‏ها
  • وجود ویروس در فایل‏ها

7-10. پشتیبانی، حفظ و امنیت داده‏ها

همه داده‏ها باید در امنیت نگهداری شود، تا مورد دسترسی نابجا، زیان یا از دست رفتن تصادفی قرار نگیرند.

مجری پژوهشی باید مطمئن باشد که همه داده‏ها مطابق کدهای حرفه‏ای (به فهرست مرجع مراجعه کنید)، قوانین اجرایی، مقررات قانونی و توافقات مذاکره شده با کارفرما، ذخیره و نگهداری شده‏اند.

داده‏های مربوط به پردازش داده‏ها ممکن است شامل موارد زیر باشد (اما تنها به این موارد محدود نمی‏شود):

الف- فایل داده‏های خام

ب- سایر فایل‏های الکترونیکی

ج- نسخه چاپی پرسشنامه‏ها و اقلام نمایش

د- کدنامه‏ها

ه- فایل‏های پروژه شامل اطلاعات مدیریت پروژه

و- پست الکترونیکی و سایر مکاتبات

مجری پژوهش باید رویه‏هایی را برقرار و حفظ کند تا اطمینان حاصل کند که فایل‏های کامپیوتری پردازش داده‏ها به وضوح مشخص شده‏اند.

هرگاه داده‏ها ویرایش، تصحیح و کدگذاری مجدد شده باشند و یا هر نوع تغییر دیگری در آن‏ها اعمال شده باشد، داده‏های اولیه، داده‏های نهایی و فایل‏های برنامه که داده‏ها را تغییر داده باید نگهداری شوند به نوعی که بتوان مجموعه داده‏های نهایی را از نو ساخت.

ممکن است پس از پردازش اصلی، تحلیل‏های اضافی دیگری درخواست شود. این نوع تحلیل‏ها باید با الزامات پردازش داده این استاندارد مطابقت داشته باشند.

برای هر واگذاری داده‏ها یا جداول، باید رویه‏هایی مناسب وجود داشته باشد تا ریسک افشای اطلاعات شناسه پاسخگو را به حداقل رساند.