लार्ज लैंग्वेज मॉडल
Appearance
लार्ज लैंग्वेज मॉडल (अंग्रेजी: Large language model) (एलएलएम — LLM) अइसन न्यूरल नेटवर्क हवे, जवन बहुत बड़ मात्रा में टेक्स्ट पर ट्रेन कइल जाला, जवना से कि ई नेचुरल लैंग्वेज प्रोसेसिंग के काम कर सके—खासकर लैंग्वेज जनरेशन खातिर।[1]
एलएलएम अलग-अलग परिस्थिति में टेक्स्ट बनावे, समरी (सारांश भा संछेप) करे, अनुबाद करे आ टेक्स्ट के विश्लेषण (पार्स) करे में सक्षम होला। आधुनिक समय के चैटबॉट के पीछे ई एगो बुनियादी टेकनीक हवे।
अगर ट्रेनिंग डेटा पक्षपात भा पूर्वग्रह भरल (बायस्ड) या गलत होखे, त एलएलएम द्वारा दिहल जवाब कम भरोसेमंद हो सके लें।[2]
संदर्भ
[संपादन करीं]- ↑ Brown, Tom B.; Mann, Benjamin; Ryder, Nick; Subbiah, Melanie; Kaplan, Jared; Dhariwal, Prafulla; Neelakantan, Arvind; Shyam, Pranav; Sastry, Girish; Askell, Amanda; Agarwal, Sandhini; Herbert-Voss, Ariel; Krueger, Gretchen; Henighan, Tom; Child, Rewon; Ramesh, Aditya; Ziegler, Daniel M.; Wu, Jeffrey; Winter, Clemens; Hesse, Christopher; Chen, Mark; Sigler, Eric; Litwin, Mateusz; Gray, Scott; Chess, Benjamin; Clark, Jack; Berner, Christopher; McCandlish, Sam; Radford, Alec; Sutskever, Ilya; Amodei, Dario (Dec 2020). Larochelle, H.; Ranzato, M.; Hadsell, R.; Balcan, M.F.; Lin, H. (eds.). "Language Models are Few-Shot Learners" (PDF). Advances in Neural Information Processing Systems. 33. Curran Associates, Inc.: 1877–1901. arXiv:2005.14165. Archived (PDF) from the original on 17 November 2023. Retrieved 14 March 2023.
- ↑ Manning, Christopher D. (2022). "Human Language Understanding & Reasoning". Daedalus. 151 (2): 127–138. doi:10.1162/daed_a_01905. S2CID 248377870. Archived from the original on 17 November 2023. Retrieved 9 March 2023.
बाहरी कड़ी
[संपादन करीं]Further reading
[संपादन करीं]- Dan Jurafsky, Martin, James. H. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 3rd Edition draft, 2023.
- Yin, Shukang; Fu, Chaoyou; Zhao, Sirui; Li, Ke; Sun, Xing; Xu, Tong; Chen, Enhong (2024). "A Survey on Multimodal Large Language Models". National Science Review. 11 (12) nwae403. arXiv:2306.13549. doi:10.1093/nsr/nwae403. PMC 11645129. PMID 39679213.
- "AI Index Report 2024 – Artificial Intelligence Index". aiindex.stanford.edu. Retrieved 5 May 2024.
- Frank, Michael C. (27 June 2023). "Baby steps in evaluating the capacities of large language models". Nature Reviews Psychology. 2 (8): 451–452. doi:10.1038/s44159-023-00211-x. ISSN 2731-0574. S2CID 259713140. Retrieved 2 July 2023.
| ई कंप्यूटर बिज्ञान-संबंधी लेख एगो आधार बाटे। जानकारी जोड़ के एकरा के बढ़ावे में विकिपीडिया के मदद करीं। |