इस वर्ष की शुरुआत में OpenAI GPT-4o पेश किया गयाGPT-4 का एक सस्ता संस्करण जो लगभग उतना ही सक्षम है। हालाँकि, GPT को पूरे इंटरनेट पर प्रशिक्षित किया जाता है, इसलिए हो सकता है कि इसमें आपके प्रोजेक्ट के लिए आउटपुट की टोन और शैली न हो – आप उस शैली को प्राप्त करने के लिए एक विस्तृत प्रॉम्प्ट तैयार करने का प्रयास कर सकते हैं या, आज से ही, आप मॉडल को ठीक कर सकते हैं।
“फाइन-ट्यूनिंग” एक AI मॉडल की अंतिम पॉलिश है। यह प्रशिक्षण के बड़े हिस्से के पूरा होने के बाद आता है, लेकिन यह अपेक्षाकृत कम प्रयास के साथ आउटपुट पर मजबूत प्रभाव डाल सकता है। OpenAI का कहना है कि आउटपुट के स्वर को बदलने के लिए बस कुछ दर्जन उदाहरण ही काफी हैं जो आपके उपयोग-मामले को बेहतर ढंग से फिट करते हैं।
उदाहरण के लिए, यदि आप चैट बॉट बनाने की कोशिश कर रहे हैं, तो आप कई प्रश्न-उत्तर जोड़े लिख सकते हैं और उन्हें GPT-4o में डाल सकते हैं। एक बार फ़ाइन-ट्यूनिंग पूरी हो जाने पर, AI के उत्तर आपके द्वारा दिए गए उदाहरणों के ज़्यादा करीब होंगे।
हो सकता है कि आपने पहले कभी AI मॉडल को फ़ाइन-ट्यून करने की कोशिश न की हो, लेकिन अब आप इसे आज़मा सकते हैं – OpenAI आपको 23 सितंबर तक 1 मिलियन ट्रेनिंग टोकन मुफ़्त में इस्तेमाल करने दे रहा है। उसके बाद, फ़ाइन-ट्यूनिंग की लागत प्रति मिलियन टोकन $25 होगी और ट्यून किए गए मॉडल का उपयोग करने पर प्रति मिलियन इनपुट टोकन $3.75 और प्रति मिलियन आउटपुट टोकन $15 होगी (ध्यान दें: आप टोकन को सिलेबल्स के रूप में सोच सकते हैं, इसलिए एक मिलियन टोकन बहुत ज़्यादा टेक्स्ट है)। OpenAI ने विस्तृत और सुलभ जानकारी दी है प्रलेखन ठीक-ठीक ट्यूनिंग पर.
कंपनी नए फीचर्स को आजमाने के लिए भागीदारों के साथ काम कर रही है। डेवलपर्स तो डेवलपर्स हैं, उन्होंने जो किया वह बेहतर कोडिंग AI बनाने की कोशिश थी। कोसाइन के पास जिनी नाम का एक AI है, जो उपयोगकर्ताओं को बग खोजने और फाइन-ट्यूनिंग विकल्प के साथ मदद कर सकता है। कोसाइन ने इसे वास्तविक उदाहरणों पर प्रशिक्षित किया।
फिर डिस्टिल है, जिसने टेक्स्ट-टू-एसक्यूएल मॉडल (SQL डेटाबेस में चीजों को देखने के लिए एक भाषा है)। यह 71.83% की सटीकता के साथ BIRD-SQL बेंचमार्क में पहले स्थान पर रहा। तुलना के लिए, मानव डेवलपर्स (डेटा इंजीनियर और छात्र) को उसी परीक्षण पर 92.96% सटीकता मिली।
आप गोपनीयता के बारे में चिंतित हो सकते हैं, लेकिन OpenAI का कहना है कि 4o को फाइन-ट्यून करने वाले उपयोगकर्ताओं के पास सभी इनपुट और आउटपुट सहित व्यावसायिक डेटा का पूर्ण स्वामित्व होता है। मॉडल को प्रशिक्षित करने के लिए आप जिस डेटा का उपयोग करते हैं, उसे कभी भी दूसरों के साथ साझा नहीं किया जाता है या अन्य मॉडलों को प्रशिक्षित करने के लिए उपयोग नहीं किया जाता है। लेकिन OpenAI दुरुपयोग की निगरानी भी कर रहा है, अगर कोई मॉडल को फाइन-ट्यून करने की कोशिश करता है जो इसकी उपयोग नीतियों का उल्लंघन करेगा।