BUSINESS

എഐ ലോകത്തെ പുതിയ മാറ്റങ്ങൾ: കൃത്യതയ്ക്ക് പെർപ്ലെക്സിറ്റിയും സ്വയം പ്രവർത്തിക്കാൻ ജിപിടി-5.5 ഉം

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സാങ്കേതികവിദ്യ അനുദിനം മാറിക്കൊണ്ടിരിക്കുകയാണ്. ദൈനംദിന ജീവിതത്തിലെ ചെറിയ സംശയങ്ങൾ മുതൽ സങ്കീർണ്ണമായ കോഡിങ് പ്രശ്നങ്ങൾക്ക് വരെ നാം ഇന്ന് എഐയെ ആശ്രയിക്കുന്നുണ്ട്. എന്നാൽ ഈ മേഖലയിൽ ഇപ്പോൾ പ്രധാനമായും രണ്ട് വലിയ മാറ്റങ്ങളാണ് സംഭവിച്ചുകൊണ്ടിരിക്കുന്നത്. വിവരങ്ങളിലെ കൃത്യതയും ആധികാരികതയും ഉറപ്പുവരുത്തുന്ന പെർപ്ലെക്സിറ്റിയുടെ (Perplexity) ജനപ്രീതിയും, മനുഷ്യന്റെ ഇടപെടലില്ലാതെ സ്വയം തീരുമാനങ്ങളെടുത്തു പ്രവർത്തിക്കാൻ പ്രാപ്തിയുള്ള ജിപിടി-5.5 (GPT-5.5) മോഡലിന്റെ അവതരണവുമാണത്. ഇവ രണ്ടും എഐ സാങ്കേതികവിദ്യയെ മറ്റൊരു തലത്തിലേക്ക് എത്തിച്ചിരിക്കുകയാണ്.

വിവരങ്ങളിലെ കൃത്യതയും പെർപ്ലെക്സിറ്റിയും

ചാറ്റ് ജിപിറ്റി ഇന്ന് വലിയൊരു ജനപ്രിയ പ്ലാറ്റ്‌ഫോമാണ്. ഒരു ഇമെയിൽ തയ്യാറാക്കാൻ മുതൽ പല ജീവിത പ്രശ്നങ്ങൾക്കും പരിഹാരം കാണാൻ വരെ ആളുകൾ ഇതിനെ ഉപയോഗിക്കുന്നു. നല്ല ക്രിയാത്മകമായ ഉത്തരങ്ങൾ നൽകാൻ ഇതിന് സാധിക്കുമെങ്കിലും, ഇതിലൊരു വലിയ പ്രശ്നം ഒളിഞ്ഞുകിടപ്പുണ്ട്. പലയിടങ്ങളിൽ നിന്നുള്ള ഡാറ്റകൾ ഉപയോഗിച്ച് പരിശീലിപ്പിച്ചതിനാൽ, ചാറ്റ് ജിപിറ്റി നൽകുന്ന വിവരങ്ങൾ പലപ്പോഴും തെറ്റോ കാലഹരണപ്പെട്ടതോ ആകാൻ സാധ്യതയുണ്ട്.

ഈ പോരായ്മ പരിഹരിച്ചുകൊണ്ടാണ് പെർപ്ലെക്സിറ്റി ശ്രദ്ധ നേടുന്നത്. എഐ നൽകുന്ന വിവരങ്ങൾ എവിടെനിന്നാണ് ശേഖരിച്ചത് എന്ന് കണ്ടെത്താനായാൽ വിവരങ്ങളിലെ വിശ്വാസ്യത വർദ്ധിക്കും. തരുന്ന ഓരോ ഉത്തരങ്ങൾക്കൊപ്പവും അതിന്റെ ഉറവിടം കൂടി വ്യക്തമാക്കുന്നതിനാൽ പെർപ്ലെക്സിറ്റി കൂടുതൽ വസ്തുതാപരമാണ്. വെറുമൊരു ചാറ്റ്ബോട്ട് എന്നതിലുപരി, പരമ്പരാഗത സെർച്ച് എഞ്ചിനുകൾക്ക് മികച്ചൊരു ബദൽ കൂടിയാണിത്. റിയൽ ടൈം വെബ് സെർച്ച് സാധ്യമാക്കുന്ന ഈ പ്ലാറ്റ്‌ഫോമിൽ പ്രോ, ബേസിക് എന്നിങ്ങനെ രണ്ട് സെർച്ച് ഓപ്ഷനുകളുണ്ട്. ഇതിന് പുറമെ, സോണാർ ലാർജ് (Sonar Large), ജിപിടി-4 ഒമ്നി (GPT-4 Omni), ക്ലോഡ് 3.5 സോണറ്റ് (Claude 3.5 Sonnet), ഗ്രോക്ക്-2 (Grok-2), ജെമിനി 2.0 ഫ്ലാഷ് (Gemini 2.0 Flash) തുടങ്ങിയ വിവിധ മോഡലുകൾ ഉപയോഗിക്കാനും പെർപ്ലെക്സിറ്റി അവസരമൊരുക്കുന്നു.

പരസ്പരം ബന്ധമുള്ള വിവരങ്ങൾ ഒരുമിച്ചാക്കാൻ സഹായിക്കുന്ന ‘സ്‌പെയ്‌സസ്’ (Spaces), താല്പര്യമുള്ള വിഷയങ്ങൾ പുതിയതായി കണ്ടെത്താനുള്ള ‘ഡിസ്കവർ’ (Discover), കൂടാതെ ചിത്രങ്ങൾ നിർമ്മിക്കാനുള്ള സൗകര്യം എന്നിവയും ഇതിലുണ്ട്. ചുരുക്കത്തിൽ, കൃത്യമായ വിവരങ്ങൾ കണ്ടെത്താൻ പെർപ്ലെക്സിറ്റിയും അവ ക്രിയാത്മകമായി ഉപയോഗിക്കാൻ ചാറ്റ് ജിപിറ്റിയും എന്നതാണ് നിലവിലെ ഒരു രീതി.

സ്വയം പ്രവർത്തിക്കുന്ന എഐ: ജിപിടി-5.5 ന്റെ വരവ്

വിവരങ്ങളുടെ കൃത്യതയ്ക്ക് പെർപ്ലെക്സിറ്റിയെ ആശ്രയിക്കുന്ന നമ്മൾ, ഇനി കാണാൻ പോകുന്നത് സ്വയം ജോലികൾ ചെയ്യാൻ പ്രാപ്തിയുള്ള എഐ മോഡലുകളെയാണ്. ഈ സമവാക്യങ്ങളെല്ലാം മാറ്റിയെഴുതിക്കൊണ്ട് ഓപ്പൺഎഐ (OpenAI) അവരുടെ പുതിയ മോഡലായ ജിപിടി-5.5 പുറത്തിറക്കിയിരിക്കുകയാണ്. വെറുമൊരു ചാറ്റ്ബോട്ട് എന്നതിലുപരി കമ്പ്യൂട്ടറുകളിൽ മനുഷ്യരെപ്പോലെ ജോലി ചെയ്യാൻ സാധിക്കുന്ന, ഇതുവരെയുള്ളതിൽ വെച്ച് ഏറ്റവും ബുദ്ധിമാനും അവബോധവുമുള്ള മോഡലായാണ് കമ്പനി ഇതിനെ അവതരിപ്പിക്കുന്നത്.

കോഡിങ്, ഡീബഗ്ഗിങ്, ഓൺലൈൻ ഗവേഷണം, ഡാറ്റ വിശകലനം എന്നിവയെല്ലാം ഇതിലൂടെ കൂടുതൽ എളുപ്പമാകും. ഓരോ ഘട്ടത്തിലും മനുഷ്യന്റെ നിർദ്ദേശങ്ങൾ കാത്തുനിൽക്കാതെ, സങ്കീർണ്ണമായ ജോലികൾ സ്വയം പ്ലാൻ ചെയ്യാനും ടൂളുകൾ ഉപയോഗിച്ച് അവ പൂർത്തിയാക്കാനും ജിപിടി-5.5 ന് സാധിക്കും എന്നതാണ് ഏറ്റവും വലിയ സവിശേഷത.

കാര്യക്ഷമതയും സുരക്ഷാ മാനദണ്ഡങ്ങളും

മുൻ മോഡലുകളെ അപേക്ഷിച്ച് കൂടുതൽ ബുദ്ധിസാമർഥ്യം പ്രകടിപ്പിക്കുമ്പോഴും ഇതിന്റെ വേഗതയിൽ യാതൊരു കുറവും വന്നിട്ടില്ല. ജിപിടി-5.4 ന്റെ അതേ വേഗതയിൽ, എന്നാൽ വളരെ കുറഞ്ഞ ടോക്കണുകൾ ഉപയോഗിച്ചാണ് പുതിയ മോഡൽ പ്രവർത്തിക്കുന്നത്. സുരക്ഷയുടെ കാര്യത്തിലും കമ്പനി യാതൊരു വിട്ടുവീഴ്ചയും ചെയ്തിട്ടില്ല. സൈബർ സുരക്ഷ, ബയോളജി തുടങ്ങിയ മേഖലകളിൽ കർശനമായ പരിശോധനകൾ നടത്തിയതിന് ശേഷമാണ് ഇത് പുറത്തിറക്കുന്നത്. മോഡൽ ദുരുപയോഗം ചെയ്യുന്നത് തടയാനായി ഇരുന്നൂറോളം വിശ്വസ്തരായ പങ്കാളികളുമായി ചേർന്ന് സുരക്ഷാ മാനദണ്ഡങ്ങൾ മുൻകൂട്ടി ഉറപ്പാക്കിയിട്ടുണ്ട്. പ്ലസ്, പ്രോ, ബിസിനസ്സ്, എന്റർപ്രൈസ് ഉപയോക്താക്കൾക്ക് ചാറ്റ്ജിപിറ്റിയിലൂടെയും കോഡെക്സിലൂടെയും (Codex) ജിപിടി-5.5 ഇപ്പോൾ ലഭ്യമാണ്. എപിഐ (API) വേർഷൻ ഉടൻ തന്നെ പുറത്തിറങ്ങും.

കോഡിങ് മേഖലയിലെ കുതിച്ചുചാട്ടം

ആഗോളതലത്തിൽ സോഫ്റ്റ്‌വെയർ എഞ്ചിനീയറിംഗ് രംഗത്ത് വലിയൊരു മാറ്റമാണ് പുതിയ മോഡൽ ലക്ഷ്യമിടുന്നത്. ആർട്ടിഫിഷ്യൽ അനാലിസിസിന്റെ കോഡിങ് സൂചിക പ്രകാരം, മികച്ച പ്രകടനം കാഴ്ചവെക്കുന്ന മറ്റ് മോഡലുകളേക്കാൾ പകുതി ചിലവിൽ ജിപിടി-5.5 പ്രവർത്തിക്കും. കോഡിങ് രംഗത്ത് ഏറ്റവും മികച്ച മോഡലാണിത്. കമാൻഡ് ലൈൻ വർക്ക്ഫ്ലോകൾ പരിശോധിക്കുന്ന ടെർമിനൽ ബെഞ്ച് 2.0-ൽ (Terminal-Bench 2.0) 82.7 ശതമാനം കൃത്യതയാണ് ഈ മോഡൽ രേഖപ്പെടുത്തിയത്. ഗിറ്റ്ഹബ്ബ് (GitHub) പ്രശ്നങ്ങൾ പരിഹരിക്കുന്ന സ്വെ-ബെഞ്ച് പ്രോയിൽ (SWE-Bench Pro) 58.6 ശതമാനം മാർക്കും, ദീർഘനേരം സമയമെടുക്കുന്ന കോഡിങ് ടാസ്ക്കുകൾക്കായുള്ള എക്സ്പെർട്ട്-എസ്ഡബ്ല്യുഇ (Expert-SWE) പരീക്ഷണങ്ങളിൽ മുൻ മോഡലുകളേക്കാൾ മികച്ച പ്രകടനവും ഇത് കാഴ്ചവെച്ചിട്ടുണ്ട്.

വിവിധ മോഡലുകളുടെ പ്രകടന നിലവാരം ഒറ്റനോട്ടത്തിൽ

വിവിധ ടെസ്റ്റുകളിൽ ജിപിടി-5.5 മറ്റ് പ്രമുഖ എഐ മോഡലുകളുമായി മത്സരിച്ചപ്പോൾ ലഭിച്ച ഫലങ്ങൾ താഴെ നൽകുന്നു:

പരീക്ഷണം (Benchmark) ജിപിടി-5.5 ജിപിടി-5.4 ജിപിടി-5.5 പ്രോ ജിപിടി-5.4 പ്രോ ക്ലോഡ് ഓപ്പസ് 4.7 ജെമിനി 3.1 പ്രോ
ടെർമിനൽ-ബെഞ്ച് 2.0 82.7% 75.1% 69.4% 68.5%
എക്സ്പെർട്ട്-എസ്ഡബ്ല്യുഇ 73.1% 68.5%
ജിഡിപിവൽ (GDPval) 84.9% 83.0% 82.3% 82.0% 80.3% 67.3%
ഒഎസ് വേൾഡ് 78.7% 75.0% 78.0%
ടൂളാത്തലോൺ 55.6% 54.6% 48.8%
ബ്രൗസ്കോംപ് 84.4% 82.7% 90.1% 89.3% 79.3% 85.9%
ഫ്രോണ്ടിയർമാത്ത് 1–3 51.7% 47.6% 52.4% 50.0% 43.8% 36.9%
ഫ്രോണ്ടിയർമാത്ത് 4 35.4% 27.1% 39.6% 38.0% 22.9% 16.7%
സൈബർജിം 81.8% 79.0%

ചുരുക്കത്തിൽ, കൃത്യതയാർന്ന വിവരങ്ങൾക്കായി പെർപ്ലെക്സിറ്റി ഉപയോഗിക്കുന്നതുപോലെ, സങ്കീർണ്ണമായ പ്രോജക്റ്റുകൾ സ്വയം ചെയ്തുതീർക്കാൻ ഒരു ഡിജിറ്റൽ സഹായിയായി ജിപിടി-5.5 മാറുന്ന കാഴ്ചയാണ് സാങ്കേതിക ലോകം ഇനി കാണാൻ പോകുന്നത്.