اصطلاح «دادههای بزرگ» مبنای گستردهایست که همۀ اطلاعات نهادها و افراد را پوشش میدهد و استخراج اطلاعات یکی از راههای دسترسی به آن است.
تکنیکهای دادهکاوی به معنی کشف و آگاهی از دادههاست. به عبارت دیگر، بهعنوان فرآیندی مؤثر برای استخراج دادههای قابل استفاده از مجموعهای بزرگ از دادههای خام است که به معنی تجزیه و تحلیل الگوهای دادهها در مجموعهدادههای بزرگ با استفاده از یک یا چند برنامه است.دادهکاوی شامل برنامههای کاربردی در زمینههای چندگانه، مانند علم و تحقیق است، اما دولتها و شرکتهای بزرگ از برنامههای کاربردی دادهکاوی برای یادگیری بیشتر دربارۀ کارکنان یا مشتریان خود استفاده میکنند و راهکارهای مؤثرتری را برای موفقیت برنامههای خود و استفاده از منابع از طریق جمعآوری اطلاعات، از طریق برنامههای الکترونیکی بهکار میبرند.
دادههای بزرگ برای هر دادهای که از لحاظ کمی بزرگ است، استفاده میشود و زمانی که هر نوع دادهای دشوار باشد، برای درک آن از روشهای سنتی در سیستمهای مدیریت پایگاه داده، مانند مایکروسافت اکسل استفاده میشود.
استخراج دادهها اساساً فرایند «جستوجو برای یافتن سوزن در انبار کاه» است. این کار از طریق فرایند ورود به مجموعههای دادۀ بزرگ انجام میشود. دادهکاوی برای تصمیمگیرندگان مهم است، زیرا به غربالگری مقدار زیادی داده برای تصمیمگیریهایی کمک میکند که با روند مورد نظر سازگار است.سیستمهای کشورهای توسعهیافته -چه در سطح دولتها و چه شرکتهای تجاری بزرگ- از طیف وسیعی از ابزارهای نوآورانه نظارت و نظارت بر عملیات پیروی میکنند. برای نمونه، در خریدهای دولتی، بهویژه زمانی که دولتها مناقصه برگزار میکنند، زمینههای مشکوک، الگوهای توافقنامهها و اطلاعات دروغین یا جعلی را بهوسیلۀ دادهها بازبینی، نظارت و بررسی میکنند. دادهکاوی برای شناسایی «هدف فاسد» در پرداختها یا معاملات از طریق تجسم دادهای اطلاعات استفاده میشود.این نوع عملیات را محققانی انجام میدهند که در یک مرکز تحقیق فساد تخصصی و به منظور بررسی حجم زیادی از مجموعهدادههای خرید عمومی متمرکز شدهاند. روش آنها دنبالکردن الگوهای غیرطبیعی، نظیر دورههای کوتاهمدت منصفانه یا نتایج غیرمعمول، نظیر عدم رقابت بیش از پیشنهاد یا پیشنهاد برندهشده از سوی شرکت به دست میآید.
ابزارهای ضدفساد برای تشخیص تقلب، ازجمله استفاده از نرمافزار در رایانههای غیرمعمول، جمعآوری مجموعهدادههای بزرگ و رویههای اداری در برنامههای استخراج هوشمند اطلاعات، در دسترس هستند.
چگونه میتوانیم از دادهکاوی برای مبارزه با فساد استفاده کنیم؟
استخراج دادهها سبب برپایی «انقلاب دادهها» توسط جریان دادهها میشود، جایی که استفاده از تکنیکهای دادهکاوی در بخش خصوصی برای شناسایی اولویتهای مشتری و پیشبینی الگوهای خرید به یک عمل معمول برای کسبوکارهای بزرگ تبدیل شده است. اما آیا میتوان از دادهکاوی برای مبارزه با فساد استفاده کرد؟ اگر چنین است، چگونه این اتفاق میافتد؟
در سال 2014 م در گرجستان، سازمان شفافیت بینالمللی پایگاه پورتالی نظارت و تجزیه و تحلیل دادهها را راهاندازی کرد که از سایتهای خرید الکترونیکی مؤسسات دولتی استخراج و دوباره در قالبهای آسان برای استفاده، جمعآوری شده است.پورتال منبع باز شامل امکان فعالکردن کاربران (کارمندان دولتی) برای ایجاد پروفایلهای تدارکات توسط سازمانهای دولتی، پروفایلهای شرکتهایی که طرف قراردادهای عمومیاند، و دادههای آماری برای هزینههای دولت جمعآوری شده است.کمیسیون اروپا در همکاری با سازمان شفافیت بینالملل برای تجزیه و تحلیل دادههای خاص از دادههای مختلف از مؤسسات عمومی و خصوصی و همچنین شناسایی پروژههایی که در معرض خطر تقلب یا بینظمی هستند، به منظور افزایش امکان کاوش دادهها و شناسایی کمبودهای در عملیات مربوط به مقامات منتخب و امور مالی دولتی، برنامهای تولید کرده است.
برنامههای استخراج اطلاعات میتوانند برای تشخیص تقلب مالیاتی و بهبود تطابق با مالیاتدهندگان استفاده شوند. بهطور مشابه، دادهکاوی میتواند برای مبارزه با پولشویی مورد استفاده قرار گیرد، زیرا حسابهای نرمافزاری اطلاعات بانکداری را بازمیگرداند و اطلاعات مربوط به دادههای جنایی که ممکن است به شناسایی جریانهای مالی غیرقانونی کمک کند، یک مسئلۀ بسیار مهم در برنامۀ سازمان شفافیت بینالمللاست.
ثروت اطلاعاتی که امروزه میتواند با سنجش از راه دور جمعآوری شود، گزارش شهروندان از منابع جمعی، رسانههای خبری، دادههای سرشماری، فعالیتهای تلفن همراه، سایتهای شبکههای اجتماعی و غیره، فرصتهای زیادی برای استخراج دادهها ارائه میدهد.
ما نمیتوانیم بدون مرکزی برای تجزیه و تحلیل دادهها بر توسعۀ ملی نظارت داشته باشیم، سیاستگذاران نیز نمیتوانند تصمیم درستی در قبال سیاستهای مورد استفاده توسط نهادهای دولتی را جز با استخراج دادهها در برنامهریزی اتخاذ نمایند.
برای رسیدن به این هدف، دادههای بزرگ را میتوان تجزیه و تحلیل کرد و اطلاعات را برای شناسایی و جلوگیری از فساد، آنهم با همکاری دانشمندان اطلاعات و مؤسسات ضد فساد برای توسعۀ برنامههای کاربردی نرمافزار هوشمند استخراج نمود و پس از آن تجزیه و تحلیل قدرتمند ضد فساد را منتشر کرد.
برای نمونه، دولت هند از درخواستی الکترونیکی به نام (من رشوه پرداخت کردم) استفاده میکند که اجازه میدهد شهروندان برخورد با رشوهخواری و تقلب کارمندان و مقامات دولتی را گزارش دهند. این برنامۀ الکترونیکی کمک کرده است تا با فساد اداری موجود در چرخههای اداری برخورد شود؛ چنین نهادهای دولتی به اکثر شهروندان آسیب میرساند.
در برزیل، دولت از برنامۀ نظارت و تجزیه و تحلیل ویژهای برای ردیابی هزینههای عمومی در شناسایی تقلب در بزرگترین برنامۀ رفاه اجتماعی استفاده کرده است. این کار با مقایسۀ لیستی از ذینفعان به ادارۀ فدرال اتومبیل و شناسایی هزاران نفر از مزایای نامعقول، انجام میشود.
انجمن اقتصاد جهانی تخمین میزند که هزینۀ فساد به بیش از 5درصد از تولید ناخالص داخلی جهان میرسد و سالانه بیش از 1تریلیون دلار رشوه پرداخت میشود. دادهکاوی یکی از مؤثرترین ابزارها در تعیین معاملات مرتبط با این رفتار غیرقانونی است. در اغلب مطالعات تقلب و فساد در حال حاضر، برای جمعآوری اطلاعات خام از سیستمهای ERPبرای پیداکردن ناهنجاریها استفاده میشود.
در تجزیه و تحلیل نهایی، عراق به مرکزی برای جمعآوری و تجزیه و تحلیل دادهها برای شناسایی نقاط ضعف در مؤسسات دولتی و خصوصی احتیاج دارد. این مراکز به استخدام و تجزیه و تحلیل اطلاعات نیاز دارند؛ سازمان شفافیت بینالملل میتواند در ایجاد چنین مرکزی کمک کند. دولت نیز میتواند برای رسیدن به هدف مورد نظر در مبارزه با فساد با شرکتهای متخصص بینالمللی همکاری کند.