Jump to content

मशीन लर्निंग

विकिपीडिया से
Scikit-learn machine learning decision tree

मशीन लर्निंग कंप्यूटर साइंस के एगो उपक्षेत्र हवे। आर्टिफिशियल इंटेलिजेंस में पैटर्न रिकग्निशन आ कम्प्यूटेशनल लर्निंग थ्योरी के अध्ययन से विकसित भइल। 1959 में आर्थर सैमुअल मशीन लर्निंग के परिभाषित कइलें कि "अध्ययन के अइसन क्षेत्र जेह में कंप्यूटर के बिना स्पष्ट रूप से प्रोग्राम कइले सीखल के क्षमता मिले ला"। मशीन लर्निंग में एल्गोरिदम सभ के अध्ययन आ निर्माण के खोज कइल जाला जे डेटा से सीख सके लें आ एकरे बारे में भविष्यवाणी क सके लें। अइसन एल्गोरिदम प्रयोगात्मक डेटा से मॉडल बना के काम करे लें ताकि डेटा के आधार पर भविष्यवाणी कइल जा सके या परिणाम के रूप में व्यक्त निर्णय निकालल जा सके।

मशीन लर्निंग के बहुत नजदीकी संबंध बा आ अक्सर कम्प्यूटेशनल स्टेटिस्टिक्स से भ्रमित कइल जाला, ई एगो अइसन बिसय हवे जे कंप्यूटर के इस्तेमाल के माध्यम से भविष्यवाणी पर भी फोकस करे ला। एकर गणितीय अनुकूलन से मजबूत संबंध बा, जवन तरीका, सिद्धांत आ अनुप्रयोग के क्षेत्र उपलब्ध करावे ला। मशीन लर्निंग के कई ठे कम्प्यूटेशनल काम सभ में लागू कइल जाला जहाँ एल्गोरिदम सभ के डिजाइन आ स्पष्ट प्रोग्रामिंग दुनों असंभव होला। एप्लीकेशन सभ के उदाहरण स्पैम फिल्टरिंग, ऑप्टिकल कैरेक्टर रिकग्निशन (OCR), सर्च इंजन आ कंप्यूटर विजन बाड़ें। मशीन लर्निंग के कबो-कबो डेटा माइनिंग से भ्रमित कइल जाला, जहाँ बाद वाला डेटा के खोजपूर्ण बिस्लेषण पर ढेर फोकस करे ला, जेकरा के अनसुपरवाइज लर्निंग भी कहल जाला।

डेटा एनालिसिस के क्षेत्र में मशीन लर्निंग एगो अइसन तरीका हवे जेकर इस्तेमाल जटिल मॉडल आ एल्गोरिदम सभ के कल्पना करे खातिर कइल जाला जेवना से भविष्यवाणी कइल जा सके ला। विश्लेषणात्मक मॉडल शोधकर्ता, डेटा वैज्ञानिक, इंजीनियर आ विश्लेषक लोग के बिस्वास जोग निर्णय आ परिणाम पैदा करे में सक्षम बनावे ला आ डेटा में ऐतिहासिक संबंध आ रुझान से सीख के सहसंबंध सभ के उजागर करे में सक्षम बनावे ला।

परिभाषा

[संपादन करीं]

टॉम एम. मिशेल एगो अउरी औपचारिक परिभाषा के प्रस्ताव रखलें जेकर इस्तेमाल बहुतायत से होला: "कहल जाला कि कंप्यूटर प्रोग्राम के काम T के एगो वर्ग के संबंध में अनुभव E से सीखल जाला आ परफार्मेंस P के माप अगर टी वर्ग के काम सभ पर ओकर परफार्मेंस के आकलन कइल जाय।" माप पी द्वारा, अनुभव ई के साथ सुधार होला"। ई परिभाषा मशीन लर्निंग के संज्ञानात्मक शब्दन के बजाय बेसिक फंक्शनल शब्दन में परिभाषित करे में महत्वपूर्ण बा, एह तरीका से एलन ट्यूरिंग के अपना पेपर "कंप्यूटिंग मशीन एंड इंटेलिजेंस" में सुझाव के पालन करत कि मशीन सोच सके लीं कि ना, एह सवाल के जगह एह सवाल से बदलल जा सके ला कि मशीन काम क सके ले कि ना हमनी के (सोचक इकाई के रूप में) का कर सकेनी जा।

समस्या आ काम के प्रकार

[संपादन करीं]

मशीन लर्निंग के काम सभ के आमतौर पर तीन गो बिसाल श्रेणी में बाँटल जाला, ई कौनों लर्निंग सिस्टम के उपलब्ध प्रशिक्षण "सिग्नल" भा "फीडबैक" के प्रकृति पर निर्भर करे ला। इहे बा।

  • सुपरवाइज लर्निंग (जेकरा के सुपरवाइज लर्निंग भी कहल जाला): कंप्यूटर प्रोग्राम के उदाहरण इनपुट के साथे-साथ "टीचर" से वांछित आउटपुट भी मिले ला, आ लक्ष्य होला कि इनपुट सभ के रिजल्ट के साथ मिलान करे खातिर एगो सामान्य नियम सीखल जाय।
  • बिना देखरेख के सीखल (अन्यथा बिना देखरेख के सीखल भा बिना देखरेख के सीखल): सीखल एल्गोरिदम के कवनो अनुभव दिहले बिना, ओकरा इनपुट डेटा के संरचना के खोज करे के पड़ी। बिना देखरेख के सीखल अपने आप में एगो अंत (डेटा में छिपल पैटर्न के खोज) हो सके ला या फिर कौनों अंत तक ले के साधन (सीखे के बिसेसता)।
  • सुदृढीकरण सीखल: कंप्यूटर प्रोग्राम अइसन गतिशील माहौल के साथ बातचीत करे ला जेह में कौनों बिसेस लक्ष्य हासिल करे के पड़े ला (जइसे कि गाड़ी चलावल), बिना कौनों शिक्षक के ई साफ-साफ बतावे के कि ऊ अपना लक्ष्य पर पहुँच गइल बा कि ना। एगो अउरी उदाहरण बा कवनो प्रतिद्वंदी के खिलाफ खेल खेलल सीखल।

पर्यवेक्षित आ बिना पर्यवेक्षित सीखन के बीच अर्ध-निगरानी सीखल होला, जहाँ शिक्षक एगो अधूरा प्रशिक्षण संकेत देला: एगो प्रशिक्षण सेट जवना में कुछ (अक्सर कई गो) लक्ष्य परिणाम गायब होखे। स्थानांतरण एह सिद्धांत के एगो खास मामला हवे, जहाँ समस्या के स्थिति सभ के सेट सीखला के समय जानल जाला, बाकी कुछ लक्ष्य सभ के कमी बा।

मशीन लर्निंग के अन्य श्रेणी सभ के अलावा, अबहिन ले एगो सीखल प्रक्रिया (मेटा लर्निंग) बाटे जे मशीन के आपन आगमनात्मक तरीका (विकसित करे) सिखावे ले, पिछला अनुभव के आधार पर। रोबोट सीखल खातिर बिकसित कइल गइल विकासात्मक रोबोटिक्स सीखल अवस्था सभ के आपन अनुक्रम बनावे ला ताकि रोबोट स्वायत्त आत्म-अन्वेषण आ मानव प्रशिक्षक लोग के साथ सामाजिक बातचीत के माध्यम से आ सक्रिय सीखल, परिपक्वता आ... नकल कइल जाला।

मशीन लर्निंग के समस्या सभ के एगो अउरी श्रेणीबद्धता तब पैदा होला जब मशीन लर्निंग सिस्टम के वांछित परिणाम पर बिचार कइल जाला।

  • वर्गीकरण में इनपुट डेटा के दू या एक से ढेर क्लास में बाँटल जाला आ मशीन के एगो मॉडल बनावे के पड़े ला, जवन डेटा के एक या एक से ढेर (मल्टी-लेबल क्लासिफिकेशन) क्लास सभ में असाइन करी। आमतौर पर ई निगरानी में सीखल जाला। स्पैम फिल्टर वर्गीकरण के उदाहरण हवे, जहाँ इनपुट ईमेल भा अउरी संदेस होला आ क्लास "स्पैम" आ "स्पैम ना" होला।
  • रिग्रेशन में, जवन एगो सुपरवाइज सीखल समस्या भी बा, परिणाम असतत ना होके लगातार होला।
  • क्लस्टरिंग में इनपुट के एगो सेट के समूह में बाँटल जाला। वर्गीकरण के बिपरीत, समूह सभ के पहिले से जानकारी ना होला, एह से ई बिभाजन एगो बिसेस रूप से बिना देखरेख के सीखल काम हवे।
  • घनत्व अनुमान में ई कुछ जगह में इनपुट डेटा के बितरण के खोज करे ला।
  •    डायमेंशनलिटी रिडक्शन के समस्या में डेटा के सरल बनावल जाला आ कम डायमेंशनल स्पेस में मैप कइल जाला। टॉपिक मॉडलिंग एगो संबंधित समस्या हवे, जहाँ मशीन से कहल जाला कि ऊ प्राकृतिक भाषा में लिखल दस्तावेज सभ के सेट से समान बिसय सभ के कवर करे वाला दस्तावेज सभ के खोज करे।

इतिहास आ दोसरा क्षेत्रन से संबंध

[संपादन करीं]

वैज्ञानिक प्रयास के रूप में मशीन लर्निंग आर्टिफिशियल इंटेलिजेंस के खोज से बढ़ल। अकादमिक स्तर प आर्टिफिशियल इंटेलिजेंस रिसर्च के शुरुआती दौर से ही डेटा से सीख लेवे वाली मशीन बनावे के सवाल शोधकर्ता के व्यस्त क देले बा। ई लोग एह समस्या के बिबिध प्रतीकात्मक तरीका से देखे के कोसिस कइल, साथ ही साथ तथाकथित न्यूरल नेटवर्क से भी। ई ज्यादातर परसेप्ट्रॉन आ मॉडल रहलें, जे जइसे कि बाद में पावल गइल, आँकड़ा के सामान्यीकृत रेखीय मॉडल सभ के पुनर्आविष्कार रहलें। संभाव्यतावादी तर्क के भी इस्तेमाल भइल बा, खासतौर पर स्वचालित चिकित्सा निदान में।

हालाँकि, संज्ञानात्मक आधारित तरीका सभ पर बढ़त जोर के कारण एआई आ मशीन लर्निंग के बीच दरार पैदा हो गइल बा। संभाव्यतावादी सिस्टम सभ में डेटा एक्वीजिशन आ रिप्रेजेंटेसन के सैद्धांतिक आ ब्यवहारिक समस्या सभ के सामना करे के पड़ल।488 1980 के दशक से आर्टिफिशियल इंटेलिजेंस के क्षेत्र में बिसेसज्ञ सिस्टम सभ के बोलबाला रहल आ आँकड़ा के भूमिका पीछे हट गइल। ए.आई. 755 न्यूरल नेटवर्क रिसर्च के एआई आ कंप्यूटर साइंस द्वारा लगभग ओही समय छोड़ दिहल गइल। आईटी आ इन्फोर्मैटिक्स से परे हॉपफील्ड, रुमेलहार्ट आ हिंटन समेत अउरी बिसय सभ के शोधकर्ता लोग भी एही दिशा के पालन कइल। सफलता 1980 के दशक के बीच में बैकप्रोपैगेशन विधि के पुनर्आविष्कार के साथ मिलल।

अलग क्षेत्र के रूप में पुनर्गठित मशीन लर्निंग 1990 के दशक के दौरान पनपे लागल। फोकस आर्टिफिशियल इंटेलिजेंस से बिरासत में मिलल प्रतीकात्मक तरीका सभ से बदल गइल, जेकर मकसद ब्यवहारिक प्रकृति के हल करे लायक समस्या सभ के समाधान कइल रहल, आँकड़ा आ संभावना सिद्धांत के तरीका आ मॉडल सभ पर जोर दिहल गइल। एकरा से भी फायदा भइल एकरा के डिजिटाइज जानकारी के उपलब्धता आ इंटरनेट पर वितरित करे के क्षमता से भी फायदा भइल।

सिद्धांत

[संपादन करीं]

प्रशिक्षु के मुख्य लक्ष्य होला कि ऊ अपना अनुभव के सामान्यीकरण कर देव. एह संदर्भ में सामान्यीकरण ( अंगरेजी : Generalization ) लर्निंग मशीन के पहिला बेर ट्रेनिंग डेटा सेट पर प्रशिक्षित कइला के बाद नया, पहिले से अनजान काम सभ पर सही तरीका से काम करे के क्षमता हवे। आमतौर पर, प्रशिक्षित करे वाला उदाहरण कुछ अज्ञात संभावना बितरण से आवे लें, जेकरा के राज्य स्पेस के प्रतिनिधित्व करे वाला मानल जाला आ मशीन के एगो सामान्य मॉडल बनावे के पड़े ला जेह से नया अवस्था सभ में पर्याप्त सटीकता के साथ भविष्यवाणी के उत्पादन के अनुमति मिले

मशीन लर्निंग एल्गोरिदम आ इनहन के परफार्मेंस के कम्प्यूटेशनल बिस्लेषण सैद्धांतिक कंप्यूटर साइंस के एगो शाखा हवे जेकरा के कम्प्यूटेशनल लर्निंग थ्योरी के नाँव से जानल जाला। चूँकि प्रशिक्षण सेट सीमित होला आ भविष्य अनिश्चित होला, सीखल सिद्धांत हमेशा एल्गोरिदम सभ के परफार्मेंस के गारंटी ना देला। एकरे बजाय, संभाव्यतावादी परफार्मेंस सीमा के अक्सर इस्तेमाल कइल जाला।

मौजूदा उदाहरण सभ पर प्रशिक्षित मॉडल अज्ञात स्थिति सभ के केतना बढ़िया से अनुमान लगा सके ला, एकरा के सामान्यीकरण कहल जाला। बेहतरीन संभव सामान्यीकरण खातिर परिकल्पना के जटिलता डेटा फंक्शन के जटिलता से मेल खाए के चाहीं।

बाकिर परफार्मेंस से परे कम्प्यूटेशनल लर्निंग थ्योरिस्ट लोग समय के जटिलता के अध्ययन करे ला आ साथ ही साथ सीखल संभव बा कि ना। कम्प्यूटेशनल लर्निंग थ्योरी में कंप्यूटेशन के संभव मानल जाला अगर बहुपद समय में कइल जा सके। समय के जटिलता के संबंध में दू तरह के परिणाम बा। सकारात्मक परिणाम मने कि बहुपद समय में मैपिंग के कौनों खास वर्ग के हासिल कइल जा सके ला आ नकारात्मक परिणाम एकरे बिपरीत बतावे ला।

मशीन लर्निंग आ सांख्यिकीय अनुमान में बहुत समानता बा, हालाँकि ई अलग-अलग शब्दन के इस्तेमाल करे लें।

मशीन लरनिंग मे इहे खोज कइल जाला जे कंप्यूटर से अइसन काज कइसे करवावल जाव जेकरा ला ओकरा प्रोग्राम नाही कइल गइल बा। एमे कंप्यूटर के ओह काम के सिखावे ला ओकरा डाटा दिहल जाला।