ارائه روشی نوین برای دسته بندی متن بر اساس مدلی ترکیبی از روش k نزدیک-ترین همسایگی و الگوریتم ژنتیک

(ثبت و پذیرش در اولین کنفرانس بین المللی علوم و مهندسی کامپیوتر دانشگاه آزاد نجف آباد-نحوه ارائه: سخنرانی- کد پذیرش مقالهHN94-01440059-سیویلیکا)

علی رضا مشکات روحانی

کارشناسی ارشد کامپیوتر- نرم افزار

چکیده

دسته­ بندی متن یکی از کاربردهای مربوط به ابزارهای داده­ کاوی و تئوری یادگیری ماشین است. در حوزه­ مذکور با استفاده از بررسی و شمارش کلمات کلیدی استفاده شده در یک متن در مورد موضوع آن تصمیم­گیری می­شود. در این راستا بسیاری از تحقیقات بر روی بهبود دقت دسته­بندی متون متمرکز شده­اند و در این حوزه برخی از پژوهشگران به بهبود روش­های مرسوم در ادبیات موضوع پرداخته­اند تا از این طریق در عملکرد آن­ها بهبود ایجاد نمایند. این تحقیق با استفاده از ترکیب الگوریتم نزدیکترین همسایگان و الگوریتم ژنتیک یک روش جدید دسته­بندی برای تشخیص متن توسعه داد. بدین منظور، الگوریتم ژنتیک با تعیین اوزانی برای متغیرها و همسایگان، دقت الگوریتم سنتی را بهبود می­بخشد. بطور دقیق­تر، الگوریتم ژنتیک در هر تکرار وزن­هایی را برای همسایگان و متغیرها تولید نموده و سعی می­کند تا با ایجاد تغییر بر روی این اوزان، دقت نهایی مدل را بهبود بخشد. شایان ذکر است که بدلیل پایین بودن چگالی ماتریس داده­ها، برخی از داده­ها و متغیرها که برای آن­ها کلیه­ مقادیر موجود برابر صفر می­باشد از مجموعه حذف گردیده است. نتایج محاسباتی مشخص نموده­اند که بهترین عملکرد مدل پیشنهادی با نرخ تقاطع 6/0، نرخ جهش 8/0، تعداد 4 همسایه و با استفاده از تابع فاصله­ی کسینوسی معادل %03/72 می­باشد. دقت مذکور بر پایه­ی روش اعتبارسنجی متقاطع 10- لایه ایجاد شده است. به علاوه، مقایسات انجام شده توسط آزمون ویلکاکسون نشان می­دهند که روش پیشنهادی نسبت به روش سنتی برتر بوده و در این راستا مقدار  برابر صفر می­باشد.

 

کلمات کلیدی: دسته­بندی متن، یادگیری با نظارت، الگوریتم نزدیک­ترین همسایگان، الگوریتم ژنتیک

 

ادامه نوشته

ارائه الگوریتمی جدید برای حذف نویز از تصاویر دیجیتالی با استفاده از  شبکه های عصبی و فیلتر میانی

ارائه الگوریتمی جدید برای حذف نویز از تصاویر دیجیتالی با استفاده از  شبکه های عصبی و فیلتر میانی

(ثبت و پذیرش نهایی در سومین کنگره بین المللی کامپیوتر، برق و مخابرات دانشگاه تربت حیدریه مشهد-نحوه ارائه: سخنرانی-کد پذیرش مقاله:itc2016-02130180)

علی رضا مشکوة روحانی

کارشناس ارشد مهندسی کامپیوتر-نرم افزار

چکیده:

در این پژوهش روش جدیدی جهت کاهش نویز از تصاویر دیجیتال ارائه شده است. این طرح میتنی بر آشکار سازی پیکسل های نویزی با استفاده از یک شبکه عصبی و یک فیلتر میانی برای تشخیص پیکسل های نویزی با استفاده از خصوصیات پیکسلهای هم جوار می باشد. در این پژوهش از ویژگیهای آماری مختلف به عنوان ورودی شبکه عصبی استفاده می شود تا قابلیت شبکه برای تفکیک پیکسل های سالم از پیکسل های نویزی افزایش یابد. تفاضل پیکسل مرکزی از میانه پنجره فیلتر و حاصل جمع چهار مقدار مینیمم انحراف پیکسل های همسایه از پیکسل مرکزی ورودی اول و دوم شبکه پیشنهادی هستند. همچنین چهار هسته لبه یاب لاپلاسین حساس به لبه های مختلف در تصویر اعمال شده اندو مقدار ماکزیمم آن ها به عنوان ورودی سوم شبکه عصبی استفاده شده است. ورودی چهارم تا هفتم این شبکه از معیارهای فیلتر میانگین رتبه مرتب سازی شده وابسته به سیگنال استفاده می کند.

کلمات کلیدی:

شبکه عصبی، نویز ضربه، نویز فلفل نمکی

 

ادامه نوشته

معیار سنجی عملکرد الگوریتم های مسیر یابی شبکه های ادهاک توسط آنتن های جهت دار در نرم افزارهای شبیه س

معیار سنجی عملکرد الگوریتم های مسیر یابی شبکه های ادهاک توسط آنتن های جهت دار در نرم افزارهای شبیه ساز

(ثبت و پذیرش نهایی در کنفرانس بین المللی مهندسی برق و کامپیوتر-سیویلیکا-كنفدراسيون بين المللي مخترعان جهان (IFIA)-کد پذیرش مقاله:cbconf15-03500159)

علی رضا مشکوة روحانی

دانشجوی کارشناسی ارشد کامپیوتر-نرم افزار 

چکیده

 شبکه ادهاک معمولا در محیطهای نظامی بکار گرفته شده است در دهه گذشته پروتکل های دسترسی رسانه و مسیر یابی بکار گرفته شده بود ولی این پروتکل ها برای شبکه هایی که از آنتن های همه جهته استفاده می کردند استفاده می شد.با پیشرفت سریع تکنولوژی آنتن،آنتن های جهت دار پیشنهاد شد تا عملکرد شبکه و مسیر یابی را در شبکه ادهاک بهبود بخشد.از آنتن های جهت دار در مسیر یابی واکنشی استفاده شده است. هدف اصلی آن کمینه کردن سربار مسیر یابی با استفاده هوشمندانه از اجزای آنتن های جهت دار برای انتشار اطلاعات مسیر یابی بوده است.نتایج تحقیقات نشان می دهد استفاده از این آنتن ها در مقایسه با آنتن های همه جهته بهتر بوده و سر بار کمتری تولید می نماید.تاثیر گستره انتقال مختلف آنتن های جهت دار مورد بررسی قرار می گیرد، در ضمن،الگوریتم های مسیر یابی چند مسیری بر اساس الگوریتم های مسیریابی بردار فاصله ادهاک و مسیریابی پویای منبع پیشنهاد شده و کارایی چندید الگوریتم مسیر یابی چند مسیری برای شبکه های ادهاک با هم مقایسه شده اند.

کلمات کلیدی:شبکه ادهاک،مسیریابی پویای منبع،مسیریاب همه جهته،مسیریابی پویشگر،مسیرهای مجازی گره ای،مسیر سیار

 

ادامه نوشته

رايانش ابري

رايانش ابري(ثبت و پذیرش در کنفرانس ملی-سیویلیکا)

علیرضا مشکوة روحانی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر-نرم افزار

کدپذیرش مقاله:ncrc15-00490006

چکیده

رایانش ابری (cloud computing) فناوری جدیدی در جهت پردازش در سرورهای بزرگ و ارائه نتایج بر روی کامپیوتر کاربران.

این پردازشها در ابر انجام می شود و بدین دلیل ابر نامیده چون با وجود لایه های مختلف از دید کاربر پنهان است و استفاده کننده فقط از آن لذت می برد. در واقع نرم افزارها بجای نصب بر روی سیستم کاربر و اشغال فضا، استفاده از حافظه، و پردازش  بر روی ابرنصب می شود و کاربرانی که قصد استفاده از این نرم افزارها را دارند از طریق اینترنت به ابر متصل و در کسری از زمان با سرعتی بیشتر از اجرای ان در کامپیوتر، اجرا می گردد.

 

واژه‌هاي كليدي : رایانش ابری- رایانش توری- سیستمهای توزیع شده- Middleware – رایانش خوشه ای

 

 مقدمه

با توجه به هزینه های سنگین نرم افزارها و سخت افزارها برای افراد و سازمانها ، تامین کنندگان فناوری برآن شدند تا راهی آسان و کم هزینه برای استفاده از امکانات و فناوریهای روز فراهم کنند تا متقاضیان از این فناوریها بتوانند با کمترین هزینه و بالاترین کیفیت خدمات مورد نیازشان را دریافت کنند و فقط به اندازه استفاده از منابع (سخت افزار یا نرم افزار) هزینه پرداخت نمایند.

برای این امر نیاز به تهیه سرورهای بسیار قدرتمند با چگالیهای بسیار بالا و پایگاهای داده در سطوح مختلف بر بستر اینترنت بود تا دسترسی را برای همگان آسان سازد و بتواند پاسخگوی نیاز کاربران باشد. پس شرکتها و غولهای نرم افزاری و سخت افزاری مانند آمازون ، مایکروسافت ، گوگل ، سالسفورس و ... وارد عرصه رایانش ابری شدند و به رقابت با یکدیگر پرداختند. البته همچون همه پروژه های بزرگ مشکلاتی نیز وجود داشت که در این مقاله سعی شده است علاوه بر بررسی و نحوه شکل گیری و پایه های رایانش ابری به گوشه ای از این چالشها نیز پرداخته شود. 

ادامه نوشته

بهبود الگوریتمFP-growth داده کاوی بامتد های ترکیبی درمحیط رایانش ابری

بهبود الگوریتمFP-growthداده کاوی بامتد های ترکیبی درمحیط رایانش ابری(ثبت و پذیرش در کنفرانس بین المللی- سیویلیکا)

کد پذیرش مقاله:cit16-00030010

چکیده :

در سالهای اخیر تولید و جمع آوری اطلاعات خام افزایش چشمگیری داشته است و روز به روز بر حجم این اطلاعات افزوده میشود . کشف روابط و وابستگیهای متقابل بین مجموعه بزرگی از اقلام داده ای که به داده کاوی قوانین انجمنی معروف است یکی از روشهای بسیار موثر در استخراج اطلاعات مفید از میان انبوه اطلاعات خام موجود درون پایگاه داده است.در این بین محیط رایانش ابری بدلیل ارایه زیرساختها ، ذخیره گاه ها و چهار چوبهای آماده ، آزمون شده و مورد اطمینان که میتوانند هزینه های ایجاد و نگهداری یک چهار چوب توسط شخص کاربر را کاهش و قابلیت اطمینان از درستی نصب را افزایش میدهد ، یکی از بهترین گزینه ها برای انجام عملیات داده کاوی میباشد.در این پژوهش الگوریتم fp-growth به منظور داده کاوی انتخاب و از متد نگاشت کاهش در محیط ابر اجرا میشود.سرعت اجرای این الگوریتم به روش نگاشت- کاهش سریعتر از الگوریتم apriori است.

واژگان کلیدی: محیط رایانش ابری،کاوش قوانین انجمنی،داده کاوی،الگوریتم fp-growth ،نگاشت-کاهش

ادامه نوشته

الگوریتمهای برتر داده کاوی

علیرضا مشکوه روحانی

دانشجوی کارشناسی ارشد کامپیوتر – نرم افزار – دانشگاه آزاد یزد

samanmeshkat@gmail.com

(ارایه در کنفرانس دانشجویی)

چکیده: داده کاوی یکی از پیشرفتهای اخیر در دو راه کامپیوتر برای اکتشاف عمقی داده هاست. داده کاوی اطلاعات پنهانی راکد برای برنامه ریزی استراتژیک می تواند حیاتی باشد را آشکار می سازد. این مقاله به بررسی  الگوریتمهای برتر داده کاوی منتصب کنفرانس بین المللی داده کاوی می پردازد و سپس یکی از جالبترین آنها یعنی الگوریتم Apriori را کمی مفصلتر تشریح می کند. این الگوریتم ها حوزه های Clustering , statistical learning – association Analysier link ming و classification را پوشش می دهد که همگی از مباحث بسیار مهم در تحقیقات داده کاوی محسوب می شوند.

 

 

واژگان کلیدی: داده کاوی، EM ، Navie beys ، CART ، Apriori ، Ada Boost KNN ، Page Rank ، C4.5 ، SVM ، K-means ، Clustering ، Classification.

ادامه نوشته

بازاریابی و ارزش افزوده

(چاپ شده در مجله تخصصی تجارت الکترونیک و رایانه)

تاریخچه بازاریابی

با به وجود آمدن انقلاب صنعتی مسئله ای به وجود آمد تحت عنوان تولید انبوه که بیانگر تولید محصول بیش از تقاضای آن در بازار بود. ( عرضه از تقاضا بسیار بالاتر بود ) صاحبان صنایع- تولیدکنندگان برای ارائه محصولات اضافی تولید شده به فکر فعالیتی افتادند که به آن بازاریابی اطلاق می گردد.

100 نوع کالا قبلا تولید می شده و مشتریان خودشان مراجعه می کردند.                    

دکتر فیلیپ کاتلر پدر علوم نوین بازاریابی نظرات جدیدی را درباره ی بازاریابی ارائه کردند که مهم ترین آنها مباحثی همچون رضایت مشتری و مشتری گرائی می باشند.

ادامه نوشته

آپلود چيست ؟

 

 

آپلود چيست؟

احتمالا" شما با واژه ‹‹ آپلود ›› آشنايي داريد و يا اگر نداريد حتما" يكبار شنيديد! حالا اين آپلود چيست؟!

پس بزاريد با چند تا سوال و جواب به اين پرسش پاسخ دهيم:

1- من فايلي دارم كه مي خواهم در دسترس كساني قرار دهم ولي اين فايل روي هارد من ذخيره شده است. چه كنم؟

2- ايميلي از دوستي براي من آمده بود كه حاوي يك لينك بود و وقتي روي آن كليك مي كردي فايل مورد نظر دانلود مي شد! دوست من چه ترفندي به كار برده!؟

3- آيا مي شود فايلي به اشتراك بگذارم، بدون استفاده از برنامه هاي p2p ؟

4- چگونه مي توانم عكس ها و فايل هاي مورد نظر خودم رو در جايي با نام خودم آپلود كنم؟

ادامه نوشته

مراکز داده( قسمت یک)

(چاپ شده در مجله تخصصی تجارت الکترونیک و رایانه)

يك نكته از هزاران...................

مراکز داده( قسمت یک)

 

مراكز داده امروز از اهميت بسيار بالايي برخوردارند. زيرا امروزه اطلاعات براي قسمتهاي مختلف بسيار مهم است پس اين مراكز كه تامين كننده اطلاعات مراكز مختلف مي باشند بايد داراي استاندارد خاصي باشند. استاندارد بين المللي معرفي شده توسط موسسه آپتايم ( uptime ) براي اين مراكز بر حسب قابليت اطمينان، وجود تجهيزات پشتيبان در مسير هاي جريان برق، سيستم تهويه، قابليت جايگزيني و عملكرد مطلوب در چهار سطح كيفي قابل دسته بندي مي باشند. در اين قسمت در راستاي ارتقاي سطح آگاهي خوانندگان محترم به توضيح استانداردهاي مكان يابي و فضاسازي اتاق هاي سرور در ديتاسنترها مي پردازيم: در توصيفي جامع، مي توان يك مركز داده را به عنوان مكاني با امنيت فيزيكي و الكترونيكي بالا، برخوردار از پهناي باند ارتباطي وسيع، متصل به شبكه هاي كامپيوتري ملي يا جهاني، با خدمات تمام وقت و در دسترس تعريف نمود كه شامل انواع تجهيزات سخت افزاري و نرم افزاري پيشرفته بوده و از پشتيباني و نگهداري حرفه اي و تمام وقت برخوردار است و به پشتيباني و ارائه انواع خدمات مرتبط با اطلاعات و داده ها از قبيل خدمات پردازش، ذخيره سازي، نگهداري و بازيابي داده ها، خدمات ERP ، ميزباني خدمات اينترنتي، ارائه خدمات كاربردي و غيره براي شركت هاي خصوصي يا دولتي، مي پردازد.

 

ادامه نوشته

دستگاههای خود پرداز و کارتهای اعتباری

(چاپ شده در مجله تخصصی تجارت الکترونیک و رایانه)

یک نکته از هزاران...................

 ( دستگاههای خود پرداز و کارتهای اعتباری )

 شما نیاز به مقداری پول دارید. بنابراین به سمت یک دستگاه خود پرداز یا Automatic Teller Machin ) ATM ) می روید، کارت را وارد دستگاه کارت خوان می کنید، دستورات به نمایش در آمده را اجرا می کنید و سپس از چند دقیقه در حالی که پول و رسید را از دستگاه تحویل گرفته اید از آنجا دور می شوید. این دستگاهها هم اکنون در سوپر مارکتها ، فروشگاههای زنجیره ای و دفاتر مسافرتی موجود هستند. برای شما عجیب نیست که چگونه سرمایه حساب شما در بانک چگونه در دستگاه خود پرداز قابل برداشت است؟

 

قسمتهای تشکیل دهنده دستگاههای خود پرداز :

 

1- کارت خوان ( ورودی) : کارت خوان اطلاعات شما را از طریق قسمت مغناطیسی کارت اعتباری که به صورت نوار مشکی رنگی در پشت کارت است می خواند – اطلاعات این نوار به دلیل مغناطیسی بودن در اثر قرار گرفتن در میدانهای موبایل یا آهنربائی اطلاعاتشان از بین می رود و اصطلاحا" کارت می سوزد- پردازشگر اصلی با استفاده از این اطلاعات قادر به تراکنش از حساب بانکی شما می باشد.

2- صفحه کلید ( ورودی ) : صفحه کلید اطلاعات مورد نیاز برای تراکنش را از صاحب کارت دریافت می کند. همچنین دستورات کاربر را برای دریافت مانده حساب و تغییر رمز را اجرا می کند برای تراکنش نیاز به PIN می باشد که توسط صفحه کلید دریافت می شود.

3- بلند گو ( خروجی ) : این امکان را میسر می کند که شما را از دریافت وجه و کارت اگاه می کند و با فشار هر کلید یک بوق می زند.

4- صفحه نمایش ( خروجی ) : دستورالعملها و عملیات تراکنش را نمایش می دهد اغلب صفحه نمایش هایی که از خطوط پر سرعت استفاده می کنند تک رنگ یا رنگی ( CRT) می باشند. دستگاههایی که از خط تلفن استفاده می کنند اغلب از صفحه نمایش تک رنگ یا رنگی ( LCD ) استفاده می کنند.

5- چاپگر رسید ( خروجی ) : این امکان را میسر می کند که رسید عملیات ترکنش را برای شما چاپ می کند.

6- توزیع کننده وجه ( خروجی ) : ( cash dispenser ) : قلب یک دستگاه خود پرداز امن مکانیزم توزیع وجه است تشخیص اسکناسهای مکانیزم توزیع وجه توسط چشم الکترونیکی است که تعداد پولهایی که در خروجی توزیع شده اند را مشخص می کند. تعداد پولها و دیگر اطلاعات وابسته به صورت دوره ای چاپ می شوند و یک کپی برای مدت 2 سال نگهداری می شود در کنار چشم الکترونیکی، برای شمردن پول، مکانیزم توزیع وجه از یک سنسور که از شیوه تشخیص کلفتی پول استفاده می کند کمک می گیرد. اگر دوتا پول به هم چسبیده باشند وقتی دستگاه شروع به توزیع پول به دارنده کارت نماید، دو پول به هم چسبیده به محفظه برگشت داده شده ها ارجاع داده می شود. این اتفاق برای پولهای تا خورده ، پاره و فرسوده نیز می افتد.

 

کارت اعتباری چیست ؟

ادامه نوشته