എഐ ലോകത്തെ പുതിയ മാറ്റങ്ങൾ: കൃത്യതയ്ക്ക് പെർപ്ലെക്സിറ്റിയും സ്വയം പ്രവർത്തിക്കാൻ ജിപിടി-5.5 ഉം
ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് സാങ്കേതികവിദ്യ അനുദിനം മാറിക്കൊണ്ടിരിക്കുകയാണ്. ദൈനംദിന ജീവിതത്തിലെ ചെറിയ സംശയങ്ങൾ മുതൽ സങ്കീർണ്ണമായ കോഡിങ് പ്രശ്നങ്ങൾക്ക് വരെ നാം ഇന്ന് എഐയെ ആശ്രയിക്കുന്നുണ്ട്. എന്നാൽ ഈ മേഖലയിൽ ഇപ്പോൾ പ്രധാനമായും രണ്ട് വലിയ മാറ്റങ്ങളാണ് സംഭവിച്ചുകൊണ്ടിരിക്കുന്നത്. വിവരങ്ങളിലെ കൃത്യതയും ആധികാരികതയും ഉറപ്പുവരുത്തുന്ന പെർപ്ലെക്സിറ്റിയുടെ (Perplexity) ജനപ്രീതിയും, മനുഷ്യന്റെ ഇടപെടലില്ലാതെ സ്വയം തീരുമാനങ്ങളെടുത്തു പ്രവർത്തിക്കാൻ പ്രാപ്തിയുള്ള ജിപിടി-5.5 (GPT-5.5) മോഡലിന്റെ അവതരണവുമാണത്. ഇവ രണ്ടും എഐ സാങ്കേതികവിദ്യയെ മറ്റൊരു തലത്തിലേക്ക് എത്തിച്ചിരിക്കുകയാണ്.
വിവരങ്ങളിലെ കൃത്യതയും പെർപ്ലെക്സിറ്റിയും
ചാറ്റ് ജിപിറ്റി ഇന്ന് വലിയൊരു ജനപ്രിയ പ്ലാറ്റ്ഫോമാണ്. ഒരു ഇമെയിൽ തയ്യാറാക്കാൻ മുതൽ പല ജീവിത പ്രശ്നങ്ങൾക്കും പരിഹാരം കാണാൻ വരെ ആളുകൾ ഇതിനെ ഉപയോഗിക്കുന്നു. നല്ല ക്രിയാത്മകമായ ഉത്തരങ്ങൾ നൽകാൻ ഇതിന് സാധിക്കുമെങ്കിലും, ഇതിലൊരു വലിയ പ്രശ്നം ഒളിഞ്ഞുകിടപ്പുണ്ട്. പലയിടങ്ങളിൽ നിന്നുള്ള ഡാറ്റകൾ ഉപയോഗിച്ച് പരിശീലിപ്പിച്ചതിനാൽ, ചാറ്റ് ജിപിറ്റി നൽകുന്ന വിവരങ്ങൾ പലപ്പോഴും തെറ്റോ കാലഹരണപ്പെട്ടതോ ആകാൻ സാധ്യതയുണ്ട്.
ഈ പോരായ്മ പരിഹരിച്ചുകൊണ്ടാണ് പെർപ്ലെക്സിറ്റി ശ്രദ്ധ നേടുന്നത്. എഐ നൽകുന്ന വിവരങ്ങൾ എവിടെനിന്നാണ് ശേഖരിച്ചത് എന്ന് കണ്ടെത്താനായാൽ വിവരങ്ങളിലെ വിശ്വാസ്യത വർദ്ധിക്കും. തരുന്ന ഓരോ ഉത്തരങ്ങൾക്കൊപ്പവും അതിന്റെ ഉറവിടം കൂടി വ്യക്തമാക്കുന്നതിനാൽ പെർപ്ലെക്സിറ്റി കൂടുതൽ വസ്തുതാപരമാണ്. വെറുമൊരു ചാറ്റ്ബോട്ട് എന്നതിലുപരി, പരമ്പരാഗത സെർച്ച് എഞ്ചിനുകൾക്ക് മികച്ചൊരു ബദൽ കൂടിയാണിത്. റിയൽ ടൈം വെബ് സെർച്ച് സാധ്യമാക്കുന്ന ഈ പ്ലാറ്റ്ഫോമിൽ പ്രോ, ബേസിക് എന്നിങ്ങനെ രണ്ട് സെർച്ച് ഓപ്ഷനുകളുണ്ട്. ഇതിന് പുറമെ, സോണാർ ലാർജ് (Sonar Large), ജിപിടി-4 ഒമ്നി (GPT-4 Omni), ക്ലോഡ് 3.5 സോണറ്റ് (Claude 3.5 Sonnet), ഗ്രോക്ക്-2 (Grok-2), ജെമിനി 2.0 ഫ്ലാഷ് (Gemini 2.0 Flash) തുടങ്ങിയ വിവിധ മോഡലുകൾ ഉപയോഗിക്കാനും പെർപ്ലെക്സിറ്റി അവസരമൊരുക്കുന്നു.
പരസ്പരം ബന്ധമുള്ള വിവരങ്ങൾ ഒരുമിച്ചാക്കാൻ സഹായിക്കുന്ന ‘സ്പെയ്സസ്’ (Spaces), താല്പര്യമുള്ള വിഷയങ്ങൾ പുതിയതായി കണ്ടെത്താനുള്ള ‘ഡിസ്കവർ’ (Discover), കൂടാതെ ചിത്രങ്ങൾ നിർമ്മിക്കാനുള്ള സൗകര്യം എന്നിവയും ഇതിലുണ്ട്. ചുരുക്കത്തിൽ, കൃത്യമായ വിവരങ്ങൾ കണ്ടെത്താൻ പെർപ്ലെക്സിറ്റിയും അവ ക്രിയാത്മകമായി ഉപയോഗിക്കാൻ ചാറ്റ് ജിപിറ്റിയും എന്നതാണ് നിലവിലെ ഒരു രീതി.
സ്വയം പ്രവർത്തിക്കുന്ന എഐ: ജിപിടി-5.5 ന്റെ വരവ്
വിവരങ്ങളുടെ കൃത്യതയ്ക്ക് പെർപ്ലെക്സിറ്റിയെ ആശ്രയിക്കുന്ന നമ്മൾ, ഇനി കാണാൻ പോകുന്നത് സ്വയം ജോലികൾ ചെയ്യാൻ പ്രാപ്തിയുള്ള എഐ മോഡലുകളെയാണ്. ഈ സമവാക്യങ്ങളെല്ലാം മാറ്റിയെഴുതിക്കൊണ്ട് ഓപ്പൺഎഐ (OpenAI) അവരുടെ പുതിയ മോഡലായ ജിപിടി-5.5 പുറത്തിറക്കിയിരിക്കുകയാണ്. വെറുമൊരു ചാറ്റ്ബോട്ട് എന്നതിലുപരി കമ്പ്യൂട്ടറുകളിൽ മനുഷ്യരെപ്പോലെ ജോലി ചെയ്യാൻ സാധിക്കുന്ന, ഇതുവരെയുള്ളതിൽ വെച്ച് ഏറ്റവും ബുദ്ധിമാനും അവബോധവുമുള്ള മോഡലായാണ് കമ്പനി ഇതിനെ അവതരിപ്പിക്കുന്നത്.
കോഡിങ്, ഡീബഗ്ഗിങ്, ഓൺലൈൻ ഗവേഷണം, ഡാറ്റ വിശകലനം എന്നിവയെല്ലാം ഇതിലൂടെ കൂടുതൽ എളുപ്പമാകും. ഓരോ ഘട്ടത്തിലും മനുഷ്യന്റെ നിർദ്ദേശങ്ങൾ കാത്തുനിൽക്കാതെ, സങ്കീർണ്ണമായ ജോലികൾ സ്വയം പ്ലാൻ ചെയ്യാനും ടൂളുകൾ ഉപയോഗിച്ച് അവ പൂർത്തിയാക്കാനും ജിപിടി-5.5 ന് സാധിക്കും എന്നതാണ് ഏറ്റവും വലിയ സവിശേഷത.
കാര്യക്ഷമതയും സുരക്ഷാ മാനദണ്ഡങ്ങളും
മുൻ മോഡലുകളെ അപേക്ഷിച്ച് കൂടുതൽ ബുദ്ധിസാമർഥ്യം പ്രകടിപ്പിക്കുമ്പോഴും ഇതിന്റെ വേഗതയിൽ യാതൊരു കുറവും വന്നിട്ടില്ല. ജിപിടി-5.4 ന്റെ അതേ വേഗതയിൽ, എന്നാൽ വളരെ കുറഞ്ഞ ടോക്കണുകൾ ഉപയോഗിച്ചാണ് പുതിയ മോഡൽ പ്രവർത്തിക്കുന്നത്. സുരക്ഷയുടെ കാര്യത്തിലും കമ്പനി യാതൊരു വിട്ടുവീഴ്ചയും ചെയ്തിട്ടില്ല. സൈബർ സുരക്ഷ, ബയോളജി തുടങ്ങിയ മേഖലകളിൽ കർശനമായ പരിശോധനകൾ നടത്തിയതിന് ശേഷമാണ് ഇത് പുറത്തിറക്കുന്നത്. മോഡൽ ദുരുപയോഗം ചെയ്യുന്നത് തടയാനായി ഇരുന്നൂറോളം വിശ്വസ്തരായ പങ്കാളികളുമായി ചേർന്ന് സുരക്ഷാ മാനദണ്ഡങ്ങൾ മുൻകൂട്ടി ഉറപ്പാക്കിയിട്ടുണ്ട്. പ്ലസ്, പ്രോ, ബിസിനസ്സ്, എന്റർപ്രൈസ് ഉപയോക്താക്കൾക്ക് ചാറ്റ്ജിപിറ്റിയിലൂടെയും കോഡെക്സിലൂടെയും (Codex) ജിപിടി-5.5 ഇപ്പോൾ ലഭ്യമാണ്. എപിഐ (API) വേർഷൻ ഉടൻ തന്നെ പുറത്തിറങ്ങും.
കോഡിങ് മേഖലയിലെ കുതിച്ചുചാട്ടം
ആഗോളതലത്തിൽ സോഫ്റ്റ്വെയർ എഞ്ചിനീയറിംഗ് രംഗത്ത് വലിയൊരു മാറ്റമാണ് പുതിയ മോഡൽ ലക്ഷ്യമിടുന്നത്. ആർട്ടിഫിഷ്യൽ അനാലിസിസിന്റെ കോഡിങ് സൂചിക പ്രകാരം, മികച്ച പ്രകടനം കാഴ്ചവെക്കുന്ന മറ്റ് മോഡലുകളേക്കാൾ പകുതി ചിലവിൽ ജിപിടി-5.5 പ്രവർത്തിക്കും. കോഡിങ് രംഗത്ത് ഏറ്റവും മികച്ച മോഡലാണിത്. കമാൻഡ് ലൈൻ വർക്ക്ഫ്ലോകൾ പരിശോധിക്കുന്ന ടെർമിനൽ ബെഞ്ച് 2.0-ൽ (Terminal-Bench 2.0) 82.7 ശതമാനം കൃത്യതയാണ് ഈ മോഡൽ രേഖപ്പെടുത്തിയത്. ഗിറ്റ്ഹബ്ബ് (GitHub) പ്രശ്നങ്ങൾ പരിഹരിക്കുന്ന സ്വെ-ബെഞ്ച് പ്രോയിൽ (SWE-Bench Pro) 58.6 ശതമാനം മാർക്കും, ദീർഘനേരം സമയമെടുക്കുന്ന കോഡിങ് ടാസ്ക്കുകൾക്കായുള്ള എക്സ്പെർട്ട്-എസ്ഡബ്ല്യുഇ (Expert-SWE) പരീക്ഷണങ്ങളിൽ മുൻ മോഡലുകളേക്കാൾ മികച്ച പ്രകടനവും ഇത് കാഴ്ചവെച്ചിട്ടുണ്ട്.
വിവിധ മോഡലുകളുടെ പ്രകടന നിലവാരം ഒറ്റനോട്ടത്തിൽ
വിവിധ ടെസ്റ്റുകളിൽ ജിപിടി-5.5 മറ്റ് പ്രമുഖ എഐ മോഡലുകളുമായി മത്സരിച്ചപ്പോൾ ലഭിച്ച ഫലങ്ങൾ താഴെ നൽകുന്നു:
| പരീക്ഷണം (Benchmark) | ജിപിടി-5.5 | ജിപിടി-5.4 | ജിപിടി-5.5 പ്രോ | ജിപിടി-5.4 പ്രോ | ക്ലോഡ് ഓപ്പസ് 4.7 | ജെമിനി 3.1 പ്രോ |
| ടെർമിനൽ-ബെഞ്ച് 2.0 | 82.7% | 75.1% | – | – | 69.4% | 68.5% |
| എക്സ്പെർട്ട്-എസ്ഡബ്ല്യുഇ | 73.1% | 68.5% | – | – | – | – |
| ജിഡിപിവൽ (GDPval) | 84.9% | 83.0% | 82.3% | 82.0% | 80.3% | 67.3% |
| ഒഎസ് വേൾഡ് | 78.7% | 75.0% | – | – | 78.0% | – |
| ടൂളാത്തലോൺ | 55.6% | 54.6% | – | – | – | 48.8% |
| ബ്രൗസ്കോംപ് | 84.4% | 82.7% | 90.1% | 89.3% | 79.3% | 85.9% |
| ഫ്രോണ്ടിയർമാത്ത് 1–3 | 51.7% | 47.6% | 52.4% | 50.0% | 43.8% | 36.9% |
| ഫ്രോണ്ടിയർമാത്ത് 4 | 35.4% | 27.1% | 39.6% | 38.0% | 22.9% | 16.7% |
| സൈബർജിം | 81.8% | 79.0% | – |
ചുരുക്കത്തിൽ, കൃത്യതയാർന്ന വിവരങ്ങൾക്കായി പെർപ്ലെക്സിറ്റി ഉപയോഗിക്കുന്നതുപോലെ, സങ്കീർണ്ണമായ പ്രോജക്റ്റുകൾ സ്വയം ചെയ്തുതീർക്കാൻ ഒരു ഡിജിറ്റൽ സഹായിയായി ജിപിടി-5.5 മാറുന്ന കാഴ്ചയാണ് സാങ്കേതിക ലോകം ഇനി കാണാൻ പോകുന്നത്.


