AI News

974

OpenAI styður lög í Illinois sem myndi takmarka hvenær AI‑laboratoríur geta verið ábyrgðarlaus

OpenAI styður lög í Illinois sem myndi takmarka hvenær AI‑laboratoríur geta verið ábyrgðarlaus
HN +18 heimildir hn
openai
OpenAI hefur formlega stutt lög í Illinois sem myndi skarpt þrengja þær aðstæður þar sem gervigreindarlaboratoríur geta verið málsakað fyrir „alvarleg skaða“. Iðnaðarfyrirtækið lagði fram vitnisburð fyrir ríkisþinginu í Illinois á þriðjudögum og hélt því fram að lagasetningin—sem er nú í vinnslu í nefnd—ætti að verja þróunaraðila gegn ábyrgð, jafnvel þegar líkön þeirra eru notuð til að valda fjöldaofbeldi eða tapum á milljörðum dollara. Tillagan skilgreinir alvarlegan skaða sem dauða eða alvarlegan meiðsli á að minnsta kosti 100 manns, eða fjármagnstap á $1 billiön eða meira, og myndi hindra stefnur gegn AI‑laboratoríum nema sækjandi geti sýnt fram á að þróunaraðili hafi viturkennt leyft
223

OpenAI setur Stargate UK í frysti, rekstrar álag vegna orkunotkunar og stjórnsýslubyrðar

OpenAI setur Stargate UK í frysti, rekstrar álag vegna orkunotkunar og stjórnsýslubyrðar
HN +6 heimildir hn
openairegulation
OpenAI hefur sett Stargate UK gagnaverkefnið í frysti og bendir á hárraða orkunotkun og „verulegt stjórnsýslubyrðar“ sem tvö hindrunar sem gera verkefnið óhagnaðlegt í nútímanum. Fyrirtækið tilkynnti hléið í yfirlýsingu til *The Register* og staðfesti að áætlunin – sem var kynnt síðasti september til að falla saman við ríkisferð fyrrverandi bandaríska forseta Donald Trump – verði endurvaknað aðeins þegar markaðs- og stefnumótunarþættir bæta sig. Ákvörðunin hefur veruleg áhrif á stefnu Breta um gervigreind. Stargate UK var lýst af breska ríkisstjórnin sem lykilfjárfestingu sem myndi festa landið í miðju alþjóðlegu AI‑miðstöðvarinnar og styðja við £31 billiön AI‑vöxtarpakka. Með því að fresta verkefninu fjarlægir OpenAI hornsteinsþátt af þeirri stefnu, sem setur í hættu þúsundir hármenntaðra starfa, staðbundna framboðarsamninga og víðari frásögn um Bretland sem sjálfstæðan leiðtogann í AI. Aðgerðina dregur einnig fram viðkvæmni greinarinnar gagnvart ytri kostnaðarþrýstingi; rafmagnsverð í Evrópu hefur hækkað verulega vegna takmarkaðs framboðs, á meðan AI‑stjórnsýslulönd í ESB‑Bretlandi er enn í umbreytingu. Aftaka OpenAI er í eftirfylgni við fjölda áfalla sem skráðir voru í byrjun þessa viku, þar á meðal dráttur úr £31 billiön UK fjárfestingarpakkanum og nýja $100‑á-mánaða ChatGPT áskrift sem tengist „Vibe“ kóðunareiginleikum. Fyrirtækið er einnig að þrýsta á löggjafarreglur sem myndu takmarka ábyrgð í AI‑studdum fjöldaáföllum, og stendur frammi fyrir rannsóknum í Flórída vegna áætlaðra áhættu fyrir ungt fólk. Saman benda þessi atriði til varfærnislegrar endurskoðunar áður en fyrirtækið áætlar að fara í almenna framboð. Hvað á að fylgjast með næst: viðbrögð bresku ríkisstjórnarinnar, þar á meðal möguleg breyting á styrkjum eða stjórnsýslukerfum sem gætu gert verkefnið hagkvæmt aftur; tímalína OpenAI til að hefja bygg
150

Skilningur á Transformerum, Partur 4: Inngangur að Sjálfathugun

Skilningur á Transformerum, Partur 4: Inngangur að Sjálfathugun
Dev.to +9 heimildir dev.to
embeddings
Rijul Rajesh’s “Understanding Transformers Part 4: Introduction to Self‑Attention” kom í loftið 9. apríl og framlengir vinsælu seríu hans sem afhjúpar byggingaruppbyggingu á bak við nútíma stórt tungumálalíkön. Nýja færslan heldur áfram frá Part 3, þar sem Rajesh útskýrði hvernig orðafyllingar (word embeddings) og staðsetningarkóðar (positional encodings) sameina merkingu og röð, og kafar í sjálfathugunarmekanismann sem gerir transformerinu kleift að meta hvert tákn gegn öllum öðrum táknum í einu ferli. Greinin brýtur niður stærðfræðina í bakgrunni fyrir spurningar‑, lykil‑ og gildistölur (query, key and value vectors), sýnir margþegið (multi‑head) athugun með kóðaútdráttum og sýnir hvernig aðgerðinni er hægt að stækka frá nokkrum táknum upp í milljarða sem eru unnin af viðskiptalegum stórum tungumálalíkönum (LLM). Með því að umbreyta abstraktum tenorsamverkum í hagnýtar dæmi gefur Rajesh forritara hagnýta innviði til að byggja eða fínstilla eigin líkan – ómetanlegur auðlind fyrir norðurlandssamfélag gervigreindar, þar sem sprotafyrirtæki og rannsóknarstofnanir taka fljótt í notkun lausnir byggðar á transformerum fyrir allt frá fjöltyngdum spjallmenum til loftslagsgagna‑greiningar. Af hverju er þetta mikilvægt? Tvöfalt. Fyrst er sjálfathugun vélin sem knýr fram samhengi‑skilning og framleiðslugetu sem hefur gert gerandi gervigreind að almennum fjármagns­vörum; að skilja hana er núna forsenda fyrir hvern alvarlegan AI‑verkfræðing. Í öðru lagi birtist greinin á tímabili þar sem fjöldi fræðandi efna reynir að minnka kunnáttu‑göflunina sem hefur tafað innleiðingu nýjustu líkana í minni evrópskum mörkuðum. Skýra, kóða‑fyrsta nálgun Rajesh er í samræmi við nýlegar tæknilegar dýptar‑greiningar sem við höfum fjallað um, eins og
130

OpenAI styður frumvarp sem myndi takmarka ábyrgð fyrir fjölda dauða eða fjármálahavna sem gerast með AI

OpenAI styður frumvarp sem myndi takmarka ábyrgð fyrir fjölda dauða eða fjármálahavna sem gerast með AI
Mastodon +7 heimildir mastodon
openai
OpenAI hefur lagt sitt af mörkum til umdeilds lögboðins frumvarps í Illinois-senati sem myndi veita AI‑þróunarfyrirtækjum lagalegan skjól þegar líkön þeirra eru notuð til að valda „fjölbreyttum“ skaða – skilgreint sem dauði eða alvarlegur áverkinn á að minnsta kosti 100 manns, eða eignatapið á $1 billiönn eða meira. Þetta tilkynning, sem kom fram í þessari viku, er fyrsta skiptið sem stórt AI‑fyrirtæki hefur opinberlega stutt lagatillögu sem í raun takmarkar borgðareyðslu vegna hörmulegra afleiðinga tengdra tækni þess. Frumvarpið, formlega kennt „AI Liability Shield Act“, myndi frjálsa fyrirtæki frá ágreiningsrétti vegna vanrækslu nema þau geti sannað að þau hafi gripið „raunhæfar aðgerðir“ til að koma í veg fyrir misnotkun. Aðilar frumvarpsins halda því fram að án slíks skjól gætu fyrirtæki orðið óhjákvæmilega áfallin af lögsögum vegna atburða sem þau geta ekki fullkomlega stjórnað, sem myndi seinka nýsköpun í hásveiflukenndum sviðum eins og sjálfvirkum vopnum, eftirliti á lykilinnviðum og stórum framleiðslu‑AI‑líkönum. Stuðningur OpenAI gefur til kynna stefnumótandi útreikning: með því að móta lögin núna vonast fyrirtækið til að forðast flókna samansafn ríki‑til‑ríki mála sem gætu komið upp vegna atvika frá sjálfkeyrandi ökutækjum til AI‑stýrðrar fjármálamarkaðsmanipúlunar. Gagnrýnendur, þar á meðal neytendaverndarsamtök og nokkrir löggjafar í Illinois, varða að skjól gæti skapað siðferðilegan áhættu, þar sem fyrirtæki myndu geta flutt ábyrgð á fórnarlömb og eftirlitsaðila. Könnun sýnir að um 90 % kjósenda í Illinois eru á móti undanþákuninni, og samvinna tæknisinnafræðinga hefur skuldbundið sig til að lobbya gegn tilrauninni. Frumvarpið er áætlað að fara í atkvæðagreiðslu í senatinu næstu mánuð, eftir það mun það fara í þinghús til að fá samsvarandi atkvæði. Viðhaldið er eftir mögulegum árekstri í Illinois‑þinginu og viðbrögðum frá öðrum ríkjum sem gætu sett fram svipað skjól. Ríki‑þingmenn í Bandaríkjunum fylgjast nú þegar með umræðunni og ímynda sér möguleikann á landsvísu umhverfi sem gæti annaðhvort kóðað eða forðað aðferð Illinois. Niðurstaðan mun móta hvernig AI‑áhætta er dreift á milli iðnaðarins í mörg ár framundan.
127

OpenAI leggur til hliðar merkilegan £31 bn fjárfestingarpakka í Bretlandi

OpenAI leggur til hliðar merkilegan £31 bn fjárfestingarpakka í Bretlandi
Mastodon +10 heimildir mastodon
copyrightopenai
OpenAI hefur slökkt á £31 billi “Stargate UK” áætluninni og stöðvað áætlanir um að byggja risala AI‑útreikningsmiðstöð í Cobalt í Northumberland. Fyrirtækið tilnefndi hárvaxandi orkukostnað og sífellt óvissara reglugerðarumhverfi sem ákvörðunarþætti bak við dráttinn. Aðgerðin lýkur áberandi samstarfi milli Bretlands og Bandaríkjanna sem átti að “flytja AI inn í efnahagslíf Bretlands”, skapa þúsundir hármenntaðra starfa og festa stað Bretlands sem evrópskt AI‑miðstöð. Fjárfestingin hefði verið stærsta einstaka erlenda AI‑ábyrgðin í sögu landsins, í samspili við $500 billi US “Stargate” útbreiðslu OpenAI. Hættunin dregur ekki aðeins úr efnahagslegum hvata í norður‑austurlöndum, heldur bendir einnig til þess að núverandi stefna og orkukerfi Bretlands geti verið óíhlýtt kröfum um háfjármögnun í nýjustu AI‑líkönum. Eins og við skýrðum 9. apríl, hefur OpenAI einnig sett í bið sérstakt gagnaverkefna samning og breytt í notkunar‑miðað verðlag fyrir Codex API, sem undirstrikar víðtækari endurskoðun á evrópsku stefnu fyrirtækisins. Nýjasta drátturinn eykur áhyggjur um að Bretland gæti misst við umfram keppinauta eins og DeepMind í Evrópu og Bandaríkjunum, þar sem meira áreiðanlegar reglugerðarleiðir og ódýrari orka þegar laða að stórtæk AI‑innviða verkefni. Það sem á eftir að fylgjast með: viðbrögð breska ríkisstjórnarinnar, þar á meðal hvort hún muni bjóða upp á markvissir styrkir, flýta fyrir AI‑leyfum eða endurskila skilmála samningsins. Geirðarfræðingar munu einnig fylgjast með hvort aðrir AI‑fyrirtæki komi til að fylla tómið, og hvernig atburðurinn hefur áhrif á komandi breska AI‑lög, sem gætu endurskapað jafnvægið milli nýsköpunarhvatna og hagsmunaverndar almennings. Útkoman mun móta þróun AI‑vistkerfisins í Bretlandi í mörg ár framundan.
124

Inside Anthropic’s Project Glasswing: AI‑líkanið sem fann zero‑day gallar í hverju stóru stýrikerfi

Inside Anthropic’s Project Glasswing: AI‑líkanið sem fann zero‑day gallar í hverju stóru stýrikerfi
Dev.to +6 heimildir dev.to
anthropic
Anthropic kynnti Project Glasswing þann 7. apríl og gaf út nýtt framhaldslíkan, Claude Mythos Preview, til handa takmarkaðs hóps af varnarmálafélögum. Líkanið hefur þegar greint þúsundir zero‑day gallna í öllum helstu stýrikerfum og vefvafrum, þar á meðal viðkvæmni sem mannlegir endurskoðendur hafa misst af í áratugi. Ræktunarfélagar — þar á meðal Microsoft, Apple, Google og nokkrir leiðandi skýjaþjónustuaðilar — munu innleiða Mythos í bug‑bounty ferla sína og innri prófunarsett, á meðan Anthropic lofar að birta samanteknar niðurstöður fyrir breiðari iðnaðinn. Tilkynningin byggir á fyrri átak fyrirtækisins til að setja AI í netöryggisvarnir, sem við fjölluðum um þann 10. apríl þegar Claude Mythos Preview var fyrst sýnt til að styrkja öryggisleiðtoga. Glasswing merkir fyrsta skipti sem líkanið er sett í stórum mæli, frá prófarkaldrif til rekstrartól sem getur skannað milljarða lína af kóða fljóttari en nokkur mannlegt teymi. Með því að koma í ljós falin nýting í forritum eldri útgáfu og nýrri uppfærslum gæti frumkvöðullinn minnkað verulega þann tíma sem líður á milli uppgötvunar og lagfæringar, sem er varanleg veikleiki í nútíma hugbúnaðar‑framboð keðju. En vald til að finna svona djúpt rætthugmyndir vekur einnig áhyggjur um tvínota notkun. Gagnrýnendur vara við því að sömu getu gæti orðið vopnað ef líkanið yrði lekið eða selt óvinveittum aðilum. Ákvörðunin hjá Anthropic um að takmarka aðgang að „aðeins-varnarmál“ samstarfsaðilum og að deila aðeins hreinsuðum gögnum er ætlað að draga úr því áhættu, en reglugerðarstjórnir og iðnaðargæslur munu líklega skoða stjórnunarumhverfið nánar. Hvað á eftir að fylgjast með: Anthropic hyggst birta fjórðungs „Glasswing Report“ sem lýsir samanteknuðum þróunarmynstri í viðkvæmni, og hefur bent á að auka samstarfsaðila til að innifela landsvísar CERT. Fyrirtækið sagði einnig að viðskiptaleg útgáfa af Claude Mythos gæti komið á markað árið 2027, sem myndi kveikja á kapphlaup milli AI‑fyrirtækja um að jafna út ógnar‑potencial með ábyrgðarmikil. Hagsmunaaðilar ættu að fylgjast með hvernig niðurstöður Glasswing hafa áhrif á lagfærsluferla, tryggingakostnað og víðtækari umræður um AI‑knúna netárásir versus varnarmál.
119

Opinberuneyti OpenAI stöðvar byggingu Stargate í Bretlandi vegna orkukostnaðar

Bloomberg +14 heimildir 2026-03-25 news
openai
OpenAI tilkynnti í dag að það stöðvar útgáfuna á „Stargate“ verkefninu um vélræna skynjun á Bretlandi, vegna hækkandi orkukostnaðar og flóknari reglugerða umhverfi. Ákvörðunin stöðvar byggingu á háþröskunarmiðstöð sem átti að hýsa næstu kynslóðar GPU-klústra fyrirtækisins og að vera miðstöð fyrir evrópska viðskiptavini. Ákvörðunin byggir á viðvaranir sem voru gefnar út 9. apríl, þegar OpenAI setti samning um gagnamiðstöðvabúnað í Bretlandi á vá. Þá hafði fyrirtækið þegar bent á að 31 milljarða punda fjárfestingarpakka sem það hafði lofað breska ríkinu gæti verið í hættu. Með því að stöðva Stargate, fer OpenAI að draga úr evrópskum reikniorðum sínum þar til orkumálsverð bætist og skýrari leiðbeiningar um vélræna skynjunarreglugerðir koma fram. Stöðvunin má ekki lítið, af því að Bretland hefur sett sjálft fram sem mögulegan AI-super-veldi, byggði á tilveru OpenAI til að draga að sér frumkvöðla, hvatja til staðbundinna birgðakeðja og réttlæta opinberar stuðningar fyrir endurnýjanlegri orku. Seiðlað gagnamiðstöð getur því verið seinkandi fyrir útgáfuna á þróttu AI-þjónustu fyrir bresk viðskipti og getur dregið úr trausti meðal annarra tækni-fyrirtækja sem eru að skoða möguleika á Evrópu-væðingu. Auk þess, sýnir ákvörðunin hvernig óstöðugar orkumarkaðir eru að endurskapa efnahag vélrænnar skynjunar, þáttur sem getur þvingað aðra skýjaþjónustuaðila til að endurskoða svipað verkefni. Það sem á að horfa á næstu vikum eru samningarnir milli OpenAI og breska viðskipta- og verslunarráðuneytis um endurskoðaðar skilmála, og hvort fyrirtækið mun flytja byggingu Stargate til lægri-kostnaðarsvæðis. Greinendur munu einnig fylgjast með svörun breska ríkisins - potentiell nýir stuðningar fyrir græna orku eða einfaldaðar AI-reglugerðir - og áhrifin á AI-infrastrútur-keppnina á Evrópu. Næstu vikur geta ákveðið hvort Bretland sé áfram á hraðalegu braut til að verða AI-miðstöð eða horfi tækifærinum annað.
111

**Ég beindi Claude Code á mín staðbundnu Ollama módel – hér er 3 mínútna uppsetningin**

**Ég beindi Claude Code á mín staðbundnu Ollama módel – hér er 3 mínútna uppsetningin**
Dev.to +9 heimildir dev.to
claudegeminillama
Claude’s new “Claude Code” agent has finally been paired with locally‑hosted Ollama models, and a three‑minute guide shows how to route the tool, the Codex CLI and even Gemini’s command‑line client through a single localhost proxy. The setup requires Ollama v0.14 or newer, an “amodelfile” that defines the base model, system prompt and generation parameters, and a lightweight proxy that translates Anthropic‑compatible API calls into Ollama’s local endpoints. Once the proxy is running, developers can invoke Claude Code without an API key, switch instantly between models such as qwen3.5, GLM‑5 or Kimi‑K2.5, and keep all code and data on‑premises. Færsla þessi er mikilvæg því hún fjarlægir tvö stærstu hindrun í daglegri AI‑studdri þróun: skýjakostnaður og gagnalekkun. Með því að halda útreikningum á fartölvu eða jaðartölvu geta teymi prófað hágæða kóðaútgáfu án þess að greiða per‑token gjöld eða láta viðkvæmar geymslur lekið. Leiðbeiningarnar sýna einnig að sama milliþjónninn getur þjónað mörgum umboðsmönnum, í samræmi við staðbundna stafla sem við fjölluðum þann 10. apríl (“TurboQuant on a MacBook”), þar sem við sýndum hvernig Ollama, MLX og sjálfvirkt beiningarlag geta skapað fullkomna AI‑umhverfi. Saman sýna þessi tvö atriði vaxandi vistkerfi af opnum hugbúnaðar‑limum sem gera “keyra‑hvar‑einhvern” AI‑þróun að raunverulegri möguleika. Áframhaldandi þróun mun snúast um hvort Anthropic útvíkkir samhæfni Claude Code utan eigin API‑sniðs, mögulega með því að taka upp OpenAI‑stíls endapunkta sem myndu leyfa hvaða staðbundið módel sem er að vera skipt út með einni stillingarbreytingu. Samfélagsþátttakendur eru þegar að birta viðmiðunarskrár sem bera saman seinkun og token‑gæði á GPU‑hröðuðum og CPU‑einungis uppsetningum, og fyrri merki benda til keppni um að hámarka verkfæraköll á lágmarks vélbúnaði. Ef milliþjónninn reynist stöðugur gætu viðbætur í IDE og CI‑pípur tekið í notkun, og breytt staðbundnum LLM‑um úr áhugamálum í aðalstoð í þróun.
106

**Forskoðun Claude Mythos frá Anthropic styrkir leiðtoga í netöryggi**

Mastodon +12 heimildir mastodon
anthropicclaude
Anthropic hefur opnað óútgefið Claude Mythos‑líkan fyrir handfærslu nokkurra netöryggisráðandi í gegnum forrit sem kallast Project Glasswing. Átakinu, sem tilkynnt var í þessari viku, veitir snemma aðgang að háþróuðu LLM-kerfinu til fyrirtækja eins og Palo Alto Networks, CrowdStrike og öryggisdeild Microsoft, ásamt sameiginlegu sjóðarfé upp á 100 milljón dollara til að flýta fyrir samþættingu og prófunum. Claude Mythos, arftaki Claude 2 frá Anthropic, er lýst sem „raðnings‑fyrst“ líkani með verulega hærri nákvæmni í kóðagerð og getu til að sameina ógnarupplýsingar úr ólíkum gagnastraumum. Með því að leyfa öryggisfyrirtækjum að prófa kerfið áður en það er opinbert sett í umferð, vonast Anthropic til að sýna fram á varnarhæfni líkanins og safna raunverulegum viðbrögðum um öryggisráðstafanir gegn misnotkun. Aðgerðin er mikilvæg á nokkrum sviðum. Fyrst og fremst bendir hún til breytingar á fyrri varúðarsjónarmiðum Anthropic – minnið á skýrslu okkar frá 10. apríl þar sem fyrirtækið taldi Mythos „of hættulegt til útgáfu“ án strangra takmarkana. Að veita stjórnað forskoðun til traustra vernda bendir til þess að fyrirtækið telji nú ávinninginn vega þyngri en áhættuna, og setur Anthropic fram sem samstarfsaðila frekar en keppinaut við hefðbundna öryggisbirgja. Í öðru lagi undirstrikar 100 milljón dollara sjóðurinn viðskiptalega eftirspurnina eftir AI‑styrktum netöryggislausnum, markað sem OpenAI og Google eru einnig að reyna að ná með eigin fyrirtækjastigslíkönum. Að lokum gæti samstarfið sett óformlegt viðmið um hvernig AI‑þróunaraðilar deila öflugum tólum með öryggissamfélaginu, og mögulega mótað iðnaðarstaðla fyrir ábyrga innleiðingu. Það sem á að fylgjast með næst eru niðurstöður tilraunaprófana: frammistöðumælikvarðar, möguleg nýleg veikleikar og hvort Anthropic muni víkka aðganginn út fyrir upphaflegu hópinn. Stjórnvöld eru líkleg til að greina samstarfið í ljósi keppnisspurninga og öryggisáhrifa, á meðan samkeppnisaðilar í AI geta flýtt fyrir eigin öryggis‑sérfræðilausnum til að halda í takt. Næstu nokkur mánuðir gætu ákveðið hvort Claude Mythos verði hornsteinn í næstu kynslóð netöryggis eða varúðar saga um of snemma birtingu.
106

OpenAI styður lögatillögu sem takmarkar ábyrgð við fjölda dauða eða fjármagnsslysa sem gerast með gervigreind

OpenAI styður lögatillögu sem takmarkar ábyrgð við fjölda dauða eða fjármagnsslysa sem gerast með gervigreind
Mastodon +11 heimildir mastodon
openai
OpenAI hefur lagt sitt af mörkum til Illinois-senatarlöggjafar 2155, tillögu sem myndi vernda þróunaraðila gervigreindar frá borgaralegri ábyrgð jafnvel þegar líkan þeirra er notað til að framkalla fjölda fórnarlamba eða milljarða dollara fjármagnstap. Fyrirtækið lagði fram vitnisburð fyrir dómstólnefnd Senatsdómara í ríkinu á þriðjudögum og hélt því fram að álagning strangrar ábyrgðar á AI‑labratoríur myndi
97

OpenAI helmingar verð ChatGPT Pro á $100 og miðar að Claude Code

OpenAI helmingar verð ChatGPT Pro á $100 og miðar að Claude Code
Mastodon +13 heimildir mastodon
claudeopenai
OpenAI tilkynnti þriðjudaginn að mánaðarleg gjald fyrir ChatGPT Pro áætluninni hafi verið minnkað um helming til $100, aðgerð sem beinist að þróunaraðilum sem hafa farið í átt að Claude Code frá Anthropic. Nýja stigið býður nú fimm sinnum meiri notkunarmörk Codex en $20‑mánaða Plus-áætlunin og inniheldur einkarétt aðgengi að GPT‑5.3‑Codex‑Spark rannsóknarforskoðuninni. Verðlagningarbreytingin fylgir útgáfu OpenAI í byrjun mánaðarins á $100‑mánaða Pro áskrift fyrir meiri Codex‑notkun, umfjöllun sem við fjölluðum þann 10. apríl. Við upphafið lofaði stigið 5× hærri mörk en einnig tímabundna 2× aukaþróun sem rennur út þann 31. maí. Með því að lækka verðið í $100 gerir OpenAI í raun þessa aukna getu að grunnviðmiði, minnkar bilið milli þeirra og sambærilegs tilboðs Anthropic og gefur til kynna að fyrirtækið sé að líta á forritunarmarkaðinn sem lykilstríðasvæði. Fyrir þróunaraðila minnkar breytingin hindrunina til að fá hágæða kóðunarhjálp sem getur framleitt, yfirfarið og endursniðið kóða í stórum mæli. Hún setur einnig þrýsting á samkeppnisaðila til að either samræma verðlagninguna eða aðgreina sig með nýjum eiginleikum, sem gæti flýtt fyrir innleiðingu AI‑stýrðra þróunartól í norrænum löndum og víðar. Hvað á að fylgjast með næst: OpenAI hefur bent á að „slysakennda“ verðlíkanið muni áfram þróast, þannig að frekari stigabreytingar eða óendanleg aðgangsáætlun gæti verið á döfinni. Greiningaraðilar munu fylgjast með áskriftarnotkun eftir að tímabundna aukaþróunin lýkur, á meðan Anthropic er væntanleg til að svara með eigin verðlagningarbreytingum fyrir Claude Code. Næstu vikur ættu að sýna hvort $100 Pro‑stigið endurskilgreini samkeppnisdýnamík AI‑hjálpaðrar hugbúnaðarverkfræði.
90

Gerðu þá heimsk, seldu þeim snjallheit

Gerðu þá heimsk, seldu þeim snjallheit
Mastodon +8 heimildir mastodon
OpenAI‑forstjóri Sam Altman kynnti djarfan nýjan tekjumódel í “AI Utility” kynningu fyrirtækisins þann 9. apríl, þar sem hann setur framleiðslu greindar sem almenningsþjónustuvara sem verður reiknuð á sama hátt og vatn eða rafmagn. Áætlunin, sem er kölluð “Intelligence‑as‑a‑Utility”, mun gjalda notendum fyrir magn “hugrænnar breiddar” sem fyrirspurnir þeirra nota, mælt í nýrri einingu sem kallast “smart‑tokens”. Þó OpenAI sé þegar að græða peninga á ChatGPT í gegnum áskriftarlíkan og API‑notkun, færir nýja gagnnýtingarlíkanið fókusinn frá föstu gjaldi til greiðslu eftir greind, sem í raun breytir hverju svar, hverri tillögu eða kóðabrotinu í mælanlega þjónustu. Altman heldur því fram að líkanið endurspegli vaxandi veruleika þess að AI‑aðstoðarmenn taka á sig minni‑ og rökvísið verkefni frá mannlegum heila. Nýlegar rannsóknir frá háskólum í Skandinavíu og Bandaríkjunum sýna að regluleg notkun á samtalsaðilum getur minnkað upplýsingalæsi og gagnrýna hugsun, þróun sem Altman viðurkennir í umfjöllun sinni. Með því að verðleggja “snjallheit” beint, vonast OpenAI til að endurgreiða risastórar reikniritkostnaðar við þjálfun sífellt stærri líkana, á sama tíma og hvatt er til skilvirkari spurninga. Tilkynningin er mikilvæg því hún gæti umbreytt því hvernig einstaklingar, fyrirtæki og stjórnvöld setja fjárhagsáætlanir fyrir AI. Gjaldkerfi í gagnnýtingarstíl gæti aukið bilið milli tæknikunnuga notenda sem geta hámarkað notkun tákna og þeirra sem geta það ekki, og vekur áhyggjur um jafnan aðgang sem endurspegla AI‑lög EU‑ins og norðurlandaleg tillögur um alhliða AI‑aðgengi. Hún bendir einnig til stefnumótandi snúninga: í stað þess að keppa eingöngu um getu líkana, leggur OpenAI áherslu á stjórn á neysluslagi. Fylgist með útgáfuáætluninni, sem Altman sagði að myndi hefjast með beta‑útgáfu fyrir fyrirtækja viðskiptavini í júní, og viðbrögðum frá eftirlitsaðilum og keppinautum eins og Google Gemini og Anthropic, sem gætu sett fram móttilboð eða lagt á sig kröfu um strangari verðgjafasýn. Næstu nokkur mánuðir munu sýna hvort “intelligence as a utility” verður ný staðlaður iðnaðarmáti eða flammabjalla í stefnumótunarríkinu.
75

Reverse‑RAG: Að byggja AI‑knúna sýndar‑prófunarumhverfi á AWS

Reverse‑RAG: Að byggja AI‑knúna sýndar‑prófunarumhverfi á AWS
Dev.to +9 heimildir dev.to
rag
Ný útgáfa af AWS‑gestuðri arkitektúr, sem hefur fengið nafnið **Reverse‑RAG**, snýr hefðbundna „retrieval‑augmented generation“ (RAG) nálguninni á hvolf. Í stað þess að draga inn ytri þekkingu í tungumálalíkani við keyrslu, fær Reverse‑RAG líkan‑framleiddan sýndar‑vinnulag aftur inn í prófunarumhverfi, þar sem það býr til dýnamískt, óvænt og ógnvekjandi prófsvæði sem líkir eftir raunverulegum jaðarskilyrðum áður en kóðinn fer í framleiðslu. Aðferðin var kynnt í tæknilegu handbók sem leiðbeinir forriturum um hvernig á að tengja Amazon Bedrock, SageMaker, Lambda og Step Functions í endurgjöfslúppu. Þegar CI/CD pípunarlínan gefur græna merki og einingapróf ganga í gegn, býr kerfið sjálfkrafa til raunveruleg notendaspurningar, rangar inntökur og gagnadrifnar aðstæður. Þessar sýndar‑viðburðir eru síðan sendir í afrit af lifandi stafli—oft ánþjónustu, oft í ívörpum—þar sem þeir kalla fram álagsbyrðar, tafavandamál og merkingarbundna bakslag sem annars myndu birtast aðeins eftir útgáfu. Af hverju er þetta mikilvægt? Fyrst og fremst eru generative AI þjónustur frásæluð viðkvæmar: lítil breyting í orðalagi spurningar getur leitt til rangra svara eða brota á stefnu sem skaðar traust við vörumerkið. Reverse‑RAG grípur þessi merkingarbundnu mistök snemma, minnkar kostnað við endursetningu og bilun í þjónustu fyrir viðskiptavini. Í öðru lagi nýtir aðferðin innbyggða AWS eftirlitsverkfæri (CloudWatch, X‑Ray) til að sýna fram á frammistöðu‑flöskuhálsa í stjórnuðu umhverfi, sem gerir teyminu kleift að fínstilla kostnaðarsamar ánþjónustu‑virkni áður en þær skala upp í milljónir beiðna. Næstu skref sem vert er að fylgjast með eru: frumnotendur sem samþætta Reverse‑RAG við vinsælar CI‑pípunarvettvang eins og GitHub Actions og GitLab CI, og tilkomu opins-kóða verkfærakassa sem einfalda AWS‑eiginleikana fyrir fjölskýja‑notkun. Keppinautar eins og Azure og Google Cloud eru líklegir til að koma með sambærilegar „synthetic staging“ þjónustur, á meðan staðla‑stofnanir gætu byrjað að setja upp bestu venjur fyrir AI‑knúna prófunarpípunar. Fyrir fyrirtæki sem hafa þegar fundið á sig áverka af AI‑tengdum framleiðsluvillum, gæti Reverse‑RAG orðið forsenda til öruggrar, skalanlegrar útsetningar.
75

Afmynda RAG‑arkitektúr fyrir fyrirtækjagögn: Tæknilegt drög

Afmynda RAG‑arkitektúr fyrir fyrirtækjagögn: Tæknilegt drög
Dev.to +9 heimildir dev.to
embeddingsragvector-db
Ný tæknileg leiðarvísir með titlinum **„Afmynda RAG‑arkitektúr fyrir fyrirtækjagögn“** hefur verið gefinn út á DEV Community vettvanginum og leggur fram skref‑fyrir‑skref drög að því hvernig byggja á framleiðslu‑stærðar Retrieval‑Augmented Generation (RAG) pípunum. Greinin leiðbeinir lesendum í gegnum kerfisbundna gagnaöflun, brotun í bita, myndun ígræðinga, vísun í vigur‑gagnagrunn og bættri spurningu (prompt augmentation), og setur RAG fram sem kostnaðar‑hagkvæma, sveigjanlega lausn í stað fullstæðrar fínstillingar líkana fyrir fyrirtækjakenningar. Útgáfan kemur í því skyni að iðnaðurinn sameinist um mótuleg AI‑stafla. NVIDIA‑„AI Blueprint for Retrieval‑Augmented Generation“ og Informatica‑„RAG Data Ingestion: Enterprise Implementation“ bjóða báðar upp á tilvísunarkitektúr sem endurspeglar sama fjögurra stiganna vinnuferli, og undirstrika samruna um bestu aðferðir. Með því að umbreyta hráum, fjölbreyttum fyrirtækjagögnum – skjölum, tengdum töflum, API‑um og atburðarstraumum – í merkingarbætar ígræðingar geta fyrirtæki haldið stórum tungumálalíkönum (LLM) uppfærðum með innri þekkingu án endurþjálfunar, minnkað reikniskostnað og stytt tímann til virðingar. Ástæðan fyrir mikilvægi þessa drög er tvíþætt. Fyrst takast drögin beint á þær veikleika sem áður voru bent á í umfjöllun okkar um takmarkanir RAG, svo sem lélegan leitarrelevans og óstöðugan spurningasamband, með því að mæla með
72

Bandaríska bankaforstjórar kallaðir til fundar um nettógnir vegna nýs AI-módel Anthropics

Bandaríska bankaforstjórar kallaðir til fundar um nettógnir vegna nýs AI-módel Anthropics
HN +8 heimildir hn
anthropic
Washington, D.C. — Ríkissjóðs- og efnahagsráðherra, Scott Bessent, og formaður Seðlabanka, Jerome Powell, kallaði í neyðarfund með forstöðumönnum stærstu banka landsins þessa viku til að vekja athygli á nýjum nettógnir sem tengjast nýjasta AI-módeli Anthropics, sem kallast „Mythos“. Fundurinn, sem var haldinn í Ríkissjóðsbyggingunni, var lýst af embættismönnum sem „brýnt“ og „óumhættanleg“. Reglufyrirkomar varuðu við það að geta Mythos til að búa til kóða, sameina raunverulegt texta og líkja eftir nettrafiki gæti verið notuð af illvilligum aðilum til að smíða flókna phishing-herferðir, sjálfvirkna öryggisprófanir og jafnvel ráða algorímska verslunar kerfi. Þar sem stórir bankar eru þegar að nota stórar tungumálamódel í svikamálarannsókn, viðskiptavinnu-venjum og áhættumatvæli, gæti brot getað valdið tjóni á starfsemi og orði bankanna. Boðið bendir til þess að ríkin skipti um stefnu frá venjulegu ráðgjafatóni í fyrra AI-fundum yfir í meiri aðgerðarstuðningu á tæknifræðum. Með því að kalla bankaforstjóra til lokaðra fundar, eru Ríkissjóður og Seðlabankinn að prófa vatnið fyrir mögulegar skyldur varnarverndir - eins og skyldu AI-áætlanir, strangari prófunarreglur og ströngari upplýsingadeilingar við Cybersecurity and Infrastructure Security Agency (CISA). Áformið endurspeglar aukinn áhyggju báða flokka á þingi um ótakmarkaðan AI-getu gæti veikt endistæði kröfuverndar. Það sem á að horfa til næst: Sameiginleg skýrsla Ríkissjóðs og Seðlabanka er vænst innan næstu tveggja vikna, líklega með nánari upplýsingum um áætlun um módel-villuprófun og áætlanir um viðbragðsáætlun. Anthropic hefur lofað að vinna með reglufyrirkomum en hefur ekki enn lýst yfir breytingum á útgáfuskipun Mythos. Löggjafarar búa til fundi um AI-stjórnun og Embætti landsskattyfirvaldsins gæti bráðum gefið út leiðbeiningar sem gætu haft áhrif á allar greinar sem byggja á AI. Næstu vikur munu sýna hvort viðvörunin leiðir til ákvæðisbundinna reglna eða verður aðeins á hæsta stigi.
69

Afturverkefni á SynthID greiningu Gemini

Afturverkefni á SynthID greiningu Gemini
HN +11 heimildir hn
geminigooglemeta
Google‑Gemini líkanið hefur lengi byggt á SynthID, óútsýnilegu vatnsmerki sem merkir AI‑framleiddan texta og myndir til að hægt sé að greina þau með SynthIDDetector-verkfærinu sem var kynnt á Google I/O 2025. Sjálfstæð rannsóknarteymi tilkynnti að það hafi náð að endurhanna greiningarvélina, og lekti í ljós tölfræðilegu mynstur og tákn‑stigs vísbendingar sem greinirinn notar til að merkja sýndarefni. Framfarirnar komu eftir að rannsakendurnir safnuðu stórum safni af útkomum frá Gemini, beittu opinberu greinirinu og gerðu síðan mismunadreifilegan greiningu til að einangra auðkenni vatnsmerkisins. Greinin, sem var sett á forprentaþjónustu, lýsir safni af skynjunaraðferðum sem geta bæði staðfest tilvist SynthID og, mikilvægast, bent á leiðir til að fjarlægja eða fela vatnsmerkið án þess að skerða gæði úttaksins. Höfundarnir leggja áherslu á að vinna þeirra er ætluð til að meta styrk vatnsmerkingar, ekki til að auðvelda illgæða misnotkun. Af hverju þetta er mikilvægt er tvíþætt. Fyrst undar uppgötvunina kröfu Google um að SynthID bjóði óbreytanlegan upprunaskilaboð fyrir AI‑framleidd efni, sem er hornsteinn stefnu fyrirtækisins í baráttunni gegn rangfærslu og í að uppfylla nýrri lagalegri kröfur um rekjanleika. Í öðru lagi ýtir endurverkefnið á vaxandi vopnabaráttu: ef hægt er að gera vatnsmerkingu óvirka, geta vettvangar, auglýsenda- og stefnumótunaraðilar þurft að leita til annarra upprunaaðferða, svo sem dulritunarskilríkja eða þriðju aðila sannprófunarþjónusta. Það sem á eftir að fylgjast með er líkleg viðbrögð Google—hvort fyrirtækið mun styrkja SynthID, koma með nýja útgáfu eða breyta yfir í annan upprunakerfi. Greindarfræðingar munu einnig fylgjast með hvernig aðrir AI‑þróunaraðilar, frá Meta til Anthropic, laga eigin vatnsmerkingar í ljósi niðurstaðna. Að lokum gætu stjórnvaldsstofnanir í ESB og Bandaríkjunum vísað í atburðinn þegar þær móta staðla um birtingu AI‑framleidds efnis, sem gæti flýtt fyrir þróun á sterkari, endurskoðanlegum lausnum til rekjanleika.
67

Fínstilling Gemma 3 með Cloud Run Jobs: Óþjónustulaus GPU-örgjörvi (NVIDIA RTX 6000 Pro) til flokkunar á gæludýraættum 🐈🐕

Fínstilling Gemma 3 með Cloud Run Jobs: Óþjónustulaus GPU-örgjörvi (NVIDIA RTX 6000 Pro) til flokkunar á gæludýraættum 🐈🐕
Dev.to +8 heimildir dev.to
fine-tuninggemmagooglenvidia
Fínstilling Gemma 3 með Cloud Run Jobs: Óþjónustugrafíkörgjörvar (NVIDIA RTX 6000 Pro) fyrir flokkun d
64

OpenAI sendi fjárfestum minnismiða þar sem það fullyrðir að það hafi 1,9 gigavött af útreikningaflæði, á móti 1,4 gigavött hjá Anthropic.

OpenAI sendi fjárfestum minnismiða þar sem það fullyrðir að það hafi 1,9 gigavött af útreikningaflæði, á móti 1,4 gigavött hjá Anthropic.
Cryptopolitan on MSN +12 heimildir 2026-04-08 news
anthropicmicrosoftopenai
OpenAI sendir fjárfestum minnismiða og fullyrðir að það hafi 1,9 gígwatt af tölvuafli í samanburði
64

OpenAI takmarkar útgáfu nýrra módelra vegna áhyggna um netöryggi

Mastodon +7 heimildir mastodon
openai
OpenAI tilkynnti á þriðjudaginn að það muni meðvitað draga úr útbreiðslu næstu kynslóða tungumálamódelanna, og vísa til áhættunnar á að tæknin gæti verið vopnað til að uppgötva hugbúnaðargalla í stórum mæli. Fyrirtækið sagði að
60

Nasdaq er í leiðréttingarsvæði. Hér eru 2 gervigreindar (AI) hlutir sem ég kaupi fyrst.

The Motley Fool on MSN +13 heimildir 2026-03-22 news
Nedsláttur Nasdaq‑ins í leiðréttingarsvæði hefur ekki minnkað áhuga á eignum tengdum gervigreind, en hann hefur neydd markaðinn til að endurmeta innviða‑hlutann sem styður uppganginn. Eins og við skýrðum þann 10. apríl 2026, voru tveir AI‑tengdir hlutir sem ég setti í fókus fyrir fyrstu kaup Nvidia (NVDA) og Microsoft (MSFT); verðlagningarbreytingar í dag gera þessar valkostir enn meira aðlaðandi. Domínans Nvidia í GPU‑hröðuðum útreikningum hefur gert fyrirtækið að de‑facto vélbúnaðaraðila fyrir generative‑AI módel, á meðan Azure‑vettvangur Microsoft nú sameinar OpenAI‑módel í pakka af fyrirtækjaþjónustum. Leiðréttingin hefur skorið um það bil 12‑15 % af framvirkum verð‑til‑sölu margföldun Nvidia og minnkað skammtímagildi Microsoft‑skýjaeiningarinnar í stig sem ekki hefur sést síðan uppgangurinn 2022, og skapað innskráningarpunkta sem samræmast langtímaspám eftirspurnar frá IDC og Gartner. Mikilvægið felst í sundurlægingu milli yfirborðsmarkaðsviðhorfa og sértækra grundvallarþátta. AI‑knúin útgjöld eru enn í uppsveiflu, þar sem fyrirtækjafjárhagsáætlanir ætla að úthluta allt að 30 % af IT‑fjármagni til AI‑vinnslu í 2026. Með því að afslá í innviða‑hlutum gæti leiðréttingin í raun flýtt útleiðslu, þar sem lægri kostnaður við útreikninga og skýjaafkoma minnkar hindrun fyrir miðstór fyrirtæki að prófa stórtungumálamódel. Fjárfestar ættu að fylgjast með þremur skammtímakatalýsum. Fyrst mun Nvidia‑fjárhagsárangur í þriðja fjórðungi sýna hvort H100 og nýlega tilkynntu GH200 örgjörvar skili væntum tekjuaukningum. Í öðru lagi mun Microsoft‑fjárhagsárangur í fjórða fjórðungi sýna áhrif Copilot‑for‑Office útgáfunnar og víkkunar Azure AI kreditanna. Að lokum munu makró‑efnahagsleg merki—sérstaklega stefna seðlabanka Bandaríkjanna varðandi vexti—ákvarða hvort breiðari tæknileiðrétting dýpki eða stöðvast, og setja svið fyrir mögulegan endurvakning sem sögulega fylgir fyrsta lokun í leiðréttingarsvæði.
60

Claude Mythos: Framtíð sjálfstæðra árásar

Mastodon +9 heimildir mastodon
anthropicautonomousclaude
Anthropic tilkynnti tilvist Claude Mythos, AI‑líkan í forprófunarstigi sem er fær um að sjálfkrafa finna núll‑dagar veikleika í helstu stýrikerfum og vafrum. Fyrirtækið sagði að kerfið virki, en það verður ekki gefið út til almennings vegna þess að það hefur farið yfir öryggismörk sem Anthropic telur iðnaðinn sé enn ekki tilbúinn til að takast á við. Útvarpið er skarpt brot frá nýlegri útgáfuáætlun Anthropic, sem hefur lagt áherslu á smávægilegar uppfærslur eins og Claude Opus 4.6 og stjórnað‑umhverfisramma. Mythos er lýst sem „framsækið“ líkan sem getur skannað kóða, netuppsetningar og keyrsluumhverfi án mannlegrar hvatningar, og framkallað nýtingarkeðjur sem hefðbundið myndu krefjast vikna af sérfræðistörfum. Í lekiðri innri minnismiða var verkfræðingar að varða að árangursprósentan líkanins við nýja veikleika er yfir 70 % – tala sem dregur úr 10 % forskriftinni sem reynsla Claude‑notenda sýndi í fjölskyldu um stjórnað umhverfi í fjölskyldu okkar 9. apríl. Af hverju er þetta mikilvægt tvíþætt. Fyrst, getu til að sjálfvirkt finna nýtingar getur þjappað líftíma veikleika, gefið árásarmönnum öflugt nýtt vopn og neyðað varnarmenn til að endurhugsa tíðni öryggisuppfærslna. Í öðru lagi bendir ákvörðun Anthropic um að halda líkanið í leynd um vaxandi viðurkenningu á því að framfarir í gervigreind eru að yfirgnæfa stjórnunarramma, í samræmi við áhyggjur sem Atlants greining „Claude Mythos er vandamál allra“ vakti. Samtímasamstillt útgáfa Project Glasswing—varnarsamstarf sem felur í sér AWS, Apple, Cisco, Google og fleiri—bendir til þess að iðnaðurinn sé að móta samstillta viðbragð áður en tæknin fer í viðskiptalega notkun. Það sem á eftir að fylgjast með eru hagnýtar aðgerðir Project Glasswing til að styrkja hugbúnaðar‑afurðarkeðjur og hvort stjórnvöld grípi inn í til að setja mörk á sjálfvirk nýtingartól. Næsta opinbera yfirlýsing Anthropic, líklega með áætlun um stjórnað ytri prófanir, verður lykilvísir um hversu hratt AI‑knúinn netvopna‑keppni þróast.
56

Florida hefir rannsókn á OpenAI, framleiðanda ChatGPT, vegna umdeildrar áhættu fyrir börn

Florida hefir rannsókn á OpenAI, framleiðanda ChatGPT, vegna umdeildrar áhættu fyrir börn
CBS News +16 heimildir 2026-04-01 news
openai
Ríkislögmaður Flórída tilkynnti þriðjudaginn að ríkið muni hefja formlega rannsókn á OpenAI, fyrirtækinu í San Francisco sem er ábyrgðarmaður ChatGPT, vegna umdeildrar áhættu sem spjallforritið hefur á börn. Rannsóknin, sem er lögð fram samkvæmt lögum um neytendavernd í ríkinu, vísar í áhyggjur af því að ófiltrað efni módel
54

80 % af RAG-bila byrjar hér (og það er ekki LLM-ið)

Dev.to +6 heimildir dev.to
geminigooglerag
Þriggja vikna djúpkönnun af norrænu fintech-teymi hefur bent á uppruna flestar rangfærslur í Retrieval‑Augmented Generation (RAG) pípunum: í leitarlagi, ekki í sjálfu stórt tungumálalíkani (LLM). Verkfræðingarnir hófu með að skipta um spurningartexta, breyta hitastigstilltum og jafnvel skipta um undirliggjandi LLM, en rangar svör héldu áfram að birtast. Aðeins eftir að þeir gerðu nákvæma mælingu á vigur‑gagnasafninu, leitar‑víkkunarrökum og skjala‑raðningsmódelinu komust þeir að því að 80 % af gölluðum úttökum voru mynduð áður en LLM‑ið hafði séð neina spurningu. Niðurstaðan endurspeglar febrúar‑leiðbeiningar sem viðvörðuðu um að “70 % af RAG-bila gerist áður en LLM‑ið er kallað,” og hún staðfestir kröfuna sem við gerðum 8. apríl: “leitin er raunverulegi líkanið” í RAG‑arkitektúr. IDC‑rannsókn, sem er vísað í í mars‑bloggi á Medium, áætlar að aðeins einn í tíu innlendum AI‑verkefnum nái yfir prófunarstig, og yfirráðandi GenAI‑leiðtogi hjá PIMCO staðfesti að sama 80 % bilatíðni gildi um fyrirtækja‑RAG‑innleiðingar. Rótarvörðurnar sem fintech‑teymið greindi eru meðal annars illa stilltir bútastærðir, úreltar ímyndanir (embeddings), ófullnægjandi síun á lýsigögnum og raðningsalgrímar sem birta óviðeigandi brot, sem öll gefa LLM‑inu villandi samhengi. Af hverju er þetta mikilvægt? Tvöfalt. Fyrst eyða fyrirtæki milljörðum í RAG‑virkjanleg vörur sem lofaða uppfærðar, upprunalega rökstuddar svör; kerfisbundnar leitarvillur draga úr trausti og auka rekstrarkostnað. Í öðru lagi er vandamálið ekki einungis ein einstök villu, heldur kerfislegur hönnunarsviga sem getur magnfært aðra áhættu, svo sem “eitraðar vefsíðu” árásir sem fjallað var um 9. apríl. Það sem á að fylgjast með næst eru nýrri sýnileikartól sem sýna leitarlatency, mikilvægi‑stig og uppruna í rauntíma, og næsta lota af uppfærslum frá skýjaþjónustuaðilum – Azure Cognitive Search’s “retrieval diagnostics” forsýning og AWS Kendra’s “ground‑truth feedback” eiginleiki eru áætlaðir til útgáfu seinna í þessu fjórðungi. Evrópskir iðnaðarsamtök eru einnig að setja upp leiðbeiningar um gagnagæði fyrir AI, sem gætu gert strangar leitarprófanir að lögfræðiskröfu. Fintech‑teymið hyggst birta ítarlegt eftirfylgiskýrsla, og aðferðafræðin gæti orðið de‑facto aðferðalista fyrir hvaða stofnun sem er sem ætlar að stækka RAG‑notkun utan rannsóknarstofunnar.
52

🤖 Eins og # WhatsApp ¹, er Telegram nú að auka hratt # AI eiginleika sína. Svo ég ákvað

Mastodon +12 heimildir mastodon
meta
Telegram hefur breytt orðspori sínu frá “messengur‑fyrst” til AI‑styrktar vettvangs, og hefur sett á markað safn af generative‑AI verkfærum sem sitja hlið við langtímastöðu bot‑vistkerfið. Útgáfan, sem var tilkynnt í stuttvídeó á opinberu rás fyrirtækisins þann 9. apríl, bætir við á‑tæki “Smart Reply” vél, AI‑drifið efnisyfirlit fyrir hópa og rásir, og samtalsaðstoð sem getur skrifað skilaboð, þýtt texta og skapað myndir með eigið líkan sem er fínstillt á OpenAI‑GPT‑4o. Fyrstu prófari, þar á meðal vinsælt tæknahúmor reikningur á Mastodon, greindu að aðstoðin getur framkallað samhengi‑meðvitaðar svör innan sekúndna, og umbreytt samtali í samvinnuskrifsvettvang. Aðgerðinni er mikilvæg vegna þess að hún minnkar virkniámuninn milli
41

Eri ég bara að vera vegan um það – racc.at bloggið

Mastodon +12 heimildir mastodon
Færsla á racc.at bloggið með titlinum „Eri ég bara að vera vegan um það“ hefur vakið athygli á hratt, yfirverkefnaæskilegu skrefi í átt að aðstoð stórra tungumálalíkana (LLM) í opnum hugbúnaðarþróun. Höfundurinn listar Vim, VLC, GStreamer, Kitty og jafnvel Linux kjarnann sem þegar prófa LLM‑stýrðar kóðatillögur, villuleiðréttingagenereringu og skjölunarsnið—verkefni sem fram að nokkrum vikum voru takmarkað við fáar frumnotkunarverkefni. Mikilvægið felst í umfangi og fjölbreytileika innleiðingarinnar. Þegar kjarnahlutar Linux‑umhverfisins byrja að treysta á AI‑framleiddan kóða, fer framkvæmdin frá sérstöku tilraunastigi yfir í de‑facto staðlað vinnuferli. Aðstoðarmenn halda því fram að LLM‑ir geti flýtt fyrir yfirferð flíða, minnkað endurtekna kóðabúnað og lækkað hindrunir fyrir nýliða. Gagnrýnendur vara við því að kóði sem er framleiddur af líkani getur leitt til fíngertra villna, óvissu um notkunarleyfi eða öryggisbakdyr sem er erfitt að yfirfara í samfélagsdrifnu kóðasafni. Tímasetning bloggsins fell
40

The Economist: Hver er Demis Hassabis, maðurinn á bak við Google DeepMind?

Biznews +11 heimildir 2026-04-07 news
deepmindgoogleopenairobotics
The Economist’s nýjasta grein dregur skynilyndi um Demis Hassabis, taugasérfræðinginn sem varð frumkvöðull og leiddi Google DeepMind frá litlu rannsóknarstofu í brennidepli alþjóðlegu kapphlaupinu um gervigreind á almennan hátt (AGI). Viðtalið kortleggur feril Hassabis frá því að vera ótrúlegur skákspilari á unglingsárum, í gegnum doktorsgráðu í hugrænni taugavísindum, til að vera meðstofnandi DeepMind árið 2010 og selja fyrirtækið til Google fyrir £400 milljón árið 2014. Í kjarnanum á hans forystu stendur „mann‑miðað“ sýn: Rannsóknaráætlun DeepMind er sett í samhengi við lausn vandamála sem bæta lífsgæði, frá byltingarkenndum niðurstöðum í prótein‑flettingu til loftslags‑líkanagerðar, frekar en að einblína eingöngu á að ná fyrirsætum frammistöðum í fjölmiðlum. Hassabis heldur því fram að byggja kerfi sem skilja og vinna með fólki sé forsenda fyrir örugga AGI, og þessi nálgun aðgreinir DeepMind frá OpenAI, sem er meira vörumiðað og leggur áherslu á fljóta útgáfu. Greinin varpar einnig ljósi á tvíþætta hlutverk Hassabis sem forstjóri Isomorphic Labs, nýs fyrirtækis Alphabet sem umbreytir AI‑framfarum DeepMind í lyfjaframleiðslu‑ferla. Þessi samruni AI og líffræðirannsókna sýnir hvers vegna fjárfestar og eftirlitsaðilar fylgjast náið með afurðum DeepMind, sem eru taldar vísbending um bæði tæknilega getu og siðferðilega stjórn. Af hverju er þetta mikilvægt núna? Tvö atriði. Fyrst hefur nýlegar fullyrðingar DeepMind um að vera nálægt mannlegri rökstuðningur vakið nýja umræða um tímalínur, öryggisreglur og þörf á samstilltu stefnumótun. Í öðru lagi gefur aðgangur fyrirtækisins að reikniritum Google það áberandi yfirburði við að stækka líkan, sem gæti breytt valdastöðu í AI‑vistkerfinu. Áhorf til framtíðar bendir á að næstu vísbendingar verði í útgáfu DeepMind á næstu kynslóð tungumálalíkans, niðurstöðum í klínískum tilraunum í gegnum Isomorphic Labs og í þeim reglugerðum sem vakna vegna „mann‑miðaðrar“ nálgunar. Hvernig Hassabis tekst á við spennuna milli opinna rannsókna og viðskipta‑leyndarmála mun móta þróun alþjóðlegu AGI‑kapphlaupsins.
40

Claude Mythos bylting Anthropic: “Project Glasswing” sett í gang til að koma í veg fyrir AI netöryggiskrísu

Claude Mythos bylting Anthropic: “Project Glasswing” sett í gang til að koma í veg fyrir AI netöryggiskrísu
Outlook Business +9 heimildir 2026-04-09 news
anthropicappleclaudegoogle
Anthropic tilkynnti kynningu á næstu kynslóðar‑líkaninu, Claude Mythos, og settist á sama tíma í gang “Project Glasswing”, alþjóðlegt samstarf milli atvinnugreina sem miðar að því að gera hugbúnað þolnari gegn árásum sem knýjað er af gervigreind. Samstarfið sameinar ský- og tæki­stórfyrirtæki – þar á meðal AWS, Apple, Google, Microsoft og fleiri en 45 aðra samstarfsaðila – til að innleiða Mythos Preview í varnarmálverkefni, leita að núll‑dagsgöllum og deila upplýsingum um lausnir um allan vistkerfið. Claude Mythos er sett fram sem „framsækið“ líkan sem sameinar dýpt rökstuðnings nýjustu stórtungumálalíkana Anthropic með sértækum kóða‑greiningarhæfileikum. Samkvæmt innri prófum greindi kerfið þúsundir alvarlegra öryggisgalla í lykilinnviðum innviða sem hefðbundnir skannar sáu ekki. Með því að veita samstarfsaðilum snemma aðgang vonast Anthropic til að skapa endurgjöfarlúppu sem flýtir viðgerð áður en nýir árásarmynstur geta orðið til vopna. Aðgerðin er mikilvæg vegna þess að sömu generative‑AI tækni sem knýr Mythos minnkar hindrunina fyrir að búa til flókið skaðlegan hugbúnað. Öryggissérfræðingar hafa varað við því að sjálfvirk útbúa nýrra árásarmynstra gæti náð mannlegri færni innan nokkurra ára, eins og var bent á í fyrri greiningu Anthropic, “Claude Mythos: The Future of Autonomous Exploits” (10. apríl). Project Glasswing er því bæði varnarmálakvarði og merki um að AI‑samfélagið taki nýja netöryggisáhættu alvarlega. Það sem á eftir að fylgjast með er útbreiðsla Mythos Preview í umhverfi samstarfsaðila og fyrstu opinberu opinberingar um galla sem kerfið uppgötvar. Greiningaraðilar munu einnig fylgjast með hvort Anthropic opni aðganginn út fyrir stofnandi samstarfsaðila, hvernig stjórnvöld bregðast við samstilltum AI‑öryggisátökum, og hvort keppinautar þrói samkeppnishæf “AI‑first” varnarlíkön. Jafnvægið milli þess að styrkja stafræna grunninn og koma í veg fyrir misnotkun tækninnar mun móta næsta kafla AI‑studdra netöryggis.
38

Frá gerandi AI til AGI og ASI – Hvert langt getur AI þróast? | Science Report | TELESCOPE magazine https://www.yayafa.com/2778155

Mastodon +7 heimildir mastodon
agents
Grein í TELESCOPE tímaritinu með titlinum „Frá gerandi AI til AGI og ASI – Hvert langt getur AI þróast?“ varpar núverandi hype‑hringrás á langtímaleiðarlínu fyrir gervigreind. Greinin heldur því fram að nútíma stórt tungumálalíkani‑knúnu framleiðslukerfi séu aðeins fyrsta stig stigveldisins sem mun að lokum leiða til gervigreindar með almennan hæfni (AGI) og síðar til gervigreindar með yfirnáttúrulega greind (ASI). Hún vísar í áþreifanleg áfangaskipti – fjölbreytt rökstuðningur, sjálfstæð námsferli og samþættingu heims‑líkananna – sem þær hæfileikar sem þarf að bæta við áður en vélar geta náð mannlegri abstraksjón og sköpun. Af hverju greinin er mikilvæg er tvíþætt. Fyrst endurskilgreinir hún keppnina um sífellt stærri líkanir sem viðskiptalegan kapphlaup í rannsóknaráætlun með samfélagslegum áherslum: AGI sem getur hannað lyf, fínstillt loftslagslíkön eða farið í samning um flókin stefnumótun gæti umbreytt efnahagskerfum og reglugerðum. Í öðru lagi varar greinin við að umbreytingin frá þröngum til almennrar greindar myndi magnbæta núverandi siðferðis‑ og öryggismál, frá gögnahneigðum til stjórnleysis, og krefst samstilltra stjórnunar á ESB‑stigi. Útlit tímaritsins fellur vel að nýlegum þróunum sem við höfum fjallað um. Útgáfa Meta á Llama
37

🎙️ Á sviðinu á BSides Luxembourg 2026: Ný fyrirlestur opinberað 🧠🤝 SAMSTARF, TRÚST, OG ÓGNIR: HVER MANNAR

Mastodon +7 heimildir mastodon
Ný seta á BSides Luxembourg 2026 setti mannlegan þátt AI‑öryggisins í ljós. Dr. Tailia Malloy, leiðandi rannsakandi á mann‑vél samvinnu, tók sviðið þann 7. maí til að kynna “Samstarf, Trúst og Ógnir: Hvernig Mannfólk Týðir Generative AI í Öryggi.” Fyrirlesturinn blandaði saman lifandi sýningum, nýlegum vettvangarrannsóknum og ógnamódelunarramma sem kortleggur hvernig öryggisgreiningaraðilar, viðbragðsaðilar og SOC‑verkfræðingar treysta á stór tungumálalíkön (LLM) við flótaskiptingu, rithöfundarannsóknir og samantekt á ógnaupplýsingum. Malloy hélt því fram að raunverulegur flöskuháls í AI‑styrktu öryggi sé ekki nákvæmni módelins heldur sálfræði trúar. Hún sýndi gögn sem sýna að greiningaraðilar treysta of mikið á AI‑tillögur þegar traustvísi er óljós, en nýta þær of lítið þegar úttak virðist of „mannlegt.“ Setað var einnig á nýrri árásarvegi: innspýting á fyrirmælum, eitur eðlismódel og dulargögn útflyt í gegnum framleiðandi umhverfis í innskráningakerfum. Með því að setja þessi vandamál í samhengi við teymisvinnu hvatti Malloy birgja til að innleiða gagnsæar upprunamerkingar og hanna „mann‑í‑hringnum“ öryggisbúnað sem varðveitir ábyrgð. Mikilvægi fyrirlestursins nær út fyrir ráðstefnusalinn. Þegar fyrirtæki setja framleiðandi AI‑aðstoðarmenn í daglegum öryggisverkefnum, eru stjórnvaldsstofnanir í ESB að útbúa leiðbeiningar um AI‑drifna ákvörðunartöku. Niðurstöður Malloy veita stefnumótendum hagnýta sönnunargögn um að trauststilling þarf að kóða með tæknistýringum. Á sama tíma er öryggissamfélagið þegar að bregðast við – nokkrir birgjar lýstu yfir beta‑prógrammum fyrir „traustvitu“ AI‑stýrikerfi, og fræðirannsóknarstofnanir segja að þær muni endurtaka tilraunir Malloy í mörgum SOC‑umhverfum. Það sem má fylgjast með næst: verkleg verkstæði um að afbryggja AI‑umhverfi sem fer fram 8. maí, eftirfylgjandi umráðasvið um AI‑stjórnun á komandi RSA‑ráðstefnu, og væntanleg hvítt skjal frá Evrópusambandsstofnuninni fyrir netöryggi sem vitnar í ramma Malloy. Samræðan sem kviknaði á BSides Luxembourg er á vegi að móta hvernig iðnaðurinn jafnar hraða, öryggi og mannlega dómgreind í öld generative AI.
37

Omar Sanseviero (@osanseviero) á X

Mastodon +11 heimildir mastodon
deepmindgeminigemmagoogle
Leiðandi þróunaraðila í Google DeepMind, Omar Sanseviero, var boðinn í 10 Downing Street þann 10. apríl, þar sem hann hitti yfirstjórnendur frá skrifstofu forsætisráðherra Bretlands. Umræða snérist um núverandi ástand opinskára stórra tungumálalíkana, breiðara AI‑landslag og þær stefnumótandi aðgerðir sem Bretland íhugar til að stuðla að ábyrgri vexti. Sanseviero tilkynnti ekki nýtt líkan, en nærvera hans merkti dýpku í samskiptum milli einnar af fremstu AI‑rannsóknarstofum heims og stjórnvalda sem eru að móta fyrstu AI‑sérstæðu stefnu sína. Fundurinn er mikilvægur því hann brýr tvö hliðstæð ferli sem hafa þróast sjálfstætt undanfarna vikur. Eins og við skýrðum 4. apríl 2026, hefur Sanseviero verið talsmaður Google DeepMind “Gemma” fjölskyldunnar af opnum líkum og Gemini API, og sett fyrirtækið fram sem talsmann fyrir gagnsæja, samfélagsdrifna AI. Tilvist hans í Downing Street bendir til þess að Bretland horfi út fyrir eigendareignar lausnir og vilji móta reglugerðarumhverfi sem hvetur til nýsköpunar í opnum líkum, á sama tíma og öryggi, gagnasjálfstæði og samkeppnisjafnvægi eru tekin til greina. Fyrir evrópska og norræna hagsmunaaðila bendir samtalið til mögulegs samræmis við AI‑lög EU og eigin opna AI‑átök norræna svæðisins. Hvað á að fylgjast með næst: AI White Paper Bretlands, sem væntanlega verður birt seinna á sumrin, mun líklega vísa til opinna líkana og gæti innihaldið fjármagnsúrræði til innlendra rannsókna. DeepMind gæti fylgt heimsókninni með hagnýtri stefnuuppástungu eða sameiginlegu tilraunaprogrammi með rannsókna stofnunum í Bretlandi. Á sama tíma benda nýlegar færslur Sanseviero um komandi útgáfu Gemma
37

Ég held áfram að segja Claude sömu hluti. Svo hann byrjaði að skrifa þau niður sjálfur.

Dev.to +6 heimildir dev.to
claude
Claude‑uppfærslan nýjasta breytir löngum vandamáli í eiginleika. Eftir marga mánuði þar sem Claude Code endurtekur sömu málfræðivillur og röng rökstuðning, lýsti Medium‑greinin af þróunaraðilanum Elliot að lausn: hann byrjaði að skrá hverja leiðrétting í sameiginlegri glósu og færa listann til baka inn í módelinn. Anthropic svaraði með því að innleiða “sjálfskráð” minnisklúfu sem sjálfkrafa skráir notenda‑veittar leiðréttingar og beitir þeim aftur í framtíðarskiptum. Breytingin kom í ljós í mars 2026 útgáfunni af Claude 3.5‑Code og er nú þegar sýnileg í vefviðmótinu, þar sem nýtt “Fix Log” spjald birtist undir kóðaspjaldið og sýnir eigin samantekt aðstoðarinnar um fyrri breytingar. Af hverju þetta skiptir máli fer langt út fyrir einfaldan þægindabreytingu. Endurtekningarvillur hafa verið helsta gagnrýni á AI‑kóðaaðstoðarmenn, sem dregur úr trausti og eykur álagið í prompt‑verkfræði. Með því að varðveita leiðréttingarskilaboð minnkar Claude Code þörfina á því að forritarar þurfa að endurtaka sömu takmarkanir, skiptir í minni þróunartíma og minnkar áhættu á tilviljunarkenndum API‑köllum eða úreltum bókasafnsleiðum. Aðgerðinni gefur einnig til kynna víðari stefnu Anthropic um að veita stórum tungumálamódelum breytilegt, notenda‑sértækt þekkingargrunn—skref í átt að “agent memory” hugmyndunum sem fjallað var um í skýrslu okkar frá 10. apríl um Claude Code í staðbundnu Ollama‑uppsetningu (sjá „I Pointed Claude Code at My Local Ollama Models — Here’s the 3‑Minute Setup“). Það sem á eftir að fylgjast með er útgáfustjórnun Fix Log í gegnum fyrirtækjaleyfi, samþætting við Claude‑API‑ið svo ytri IDE‑forrit geti spurt um geymdar leiðréttingar, og hvort Anthropic opni skráasniðið fyrir samfélagsbyggðar viðbætur. Keppinautar eru líklegir til að fylgja í kjölfarið, og forritarar gætu séð nýja bylgju af „persónulegum AI‑aðstoðarmönnum“ sem muna sértækar eiginleika verkefna án þess að þurfa stöðugra spurningar. Alvöruprófið verður hvort minnisklúfan haldist yfir tæki og hversu öruggt hún meðhöndlar eignarlegan kóða—málefni sem mun móta næstu kynslóð AI‑stýrðra þróunartól.
37

Meta, innfædd fjölbreytt LLM „Llama 4“ – Impress Watch https://www.yayafa.com/2778136/ # AgenticAi

Mastodon +13 heimildir mastodon
agentsllamameta
Meta hefur kynnt Llama 4, sitt fyrsta innfæða fjölbreytta stórt tungumálamódel, og gefið út þyngdirnar undir opnu þyngdarlýsingu. Módelið byggir á blöndu af sérfræðingum (Mixture‑of‑Experts, MoE) í kjarnanum og sameinar texta, myndir og myndbönd í fyrstu ferli vinnslu – hönnun sem Meta kallar „snemma samruni“. Með því að þjálfa á milljörðum ómerktra texta-, mynd- og myndbandaútdráttar lærir Llama 4 sameinaða framsetningu án dýrmættra merkningarfærða sem hafa takmarkað fyrri sjón‑tungumála kerfi. Tilkynningin er mikilvæg af þremur ástæðum. Fyrst felur innfædd fjölbreytni í sér að ekki þarf sérstaka sjónkóðara og tungumálamódel, sem minnkar töf og einfalda útgáfu fyrir þróunaraðila sem byggja sjálfstýrandi gervigreindaraðstoðarmenn, efnisframleiðslutól eða leitarvél í netverslun. Í öðru lagi veitir MoE‑arkitektúr hágæða niðurstöðu á meðan reikniskröfur eru í hófi; Meta segir að minnsta útgáfa Llama 4 gangi á einu NVIDIA H100 GPU, sem lækkar hindrunina fyrir rannsóknarstofnanir og norrænar sprotafyrirtæki sem ekki hafa aðgang að stórum klösum. Í þriðja lagi býður opna útgáfan þyngda samfélaginu að fínstilla, gera úttekt og þróa módelinn, sem
36

OpenAI hefur hafist við rannsókn af fulltrúi Flórída um mögulega tengingu við skotdrepið við Florida State University – GIGAZINE https://www.yayafa.com/2778295/ #

Mastodon +11 heimildir mastodon
agentsopenai
Ríkisstjórnarfulltrúi Flórída hefur opnað formlega rannsókn á OpenAI vegna ásakana um að spjallforritið þeirra, ChatGPT, hafi verið notað til að skipuleggja fjöldaskotið árið 2025 við Florida State University. James Usmaier lagði fram rannsóknina eftir að dómskjöl sýndu meira en 270 samtalsskráir frá ChatGPT sem voru lögð fram sem sönnunargögn, þar sem sumir skráir virðast innihalda fyrirspurnir um vopnabúnað, taktísk ráð og val á áhrifaþegnum. Rannsóknin, sem var tilkynnt á fimmtudaginn, miðar að því að komast að því hvort öryggisstýringar OpenAI hafi misst af því að hindra ólöglegt efni og hvort fyrirtækið beri ábyrgð á að hafa auðveldað árásina. Málefninu er mikilvægt vegna þess að þetta er fyrsta háprofíls refsarannsókn sem tengir beint generative‑AI þjónustu við ofbeldi í skólum. Ákærendur halda því fram að „aðgerðargáfa“ vettvangsins – hæfileikinn til að búa til nákvæmar, samhengi‑meðvitaðar leiðbeiningar – gæti verið nýtt til vopnabúnaðar ef ekki er rétt stjórnað. OpenAI, sem hefur sett á markað sífellt sjálfstæðari módel, þar á meðal nýlega tilkynnt Muse Spark og Llama 4, hefur fengið gagnrýni fyrir jafnvægi milli opins kerfis og öryggis. Ef niðurstaða sýnir vanrækslu gæti það þvingað fyrirtækið til að skerpa á innihaldsúrvinnslu, innleiða strangari aldursstaðfestingarferla eða jafnvel takast á við borgunarbót. Það sem á eftir að fylgjast með eru ferli rannsóknarinnar: boð um innri skráir, möguleg þvingun til opinberrar upplýsinga, og bráðabirgðaákvarðanir um notkun ChatGPT í opinberu umhverfi í Bandaríkjunum. OpenAI er vænt um að gefa út opinberan svar innan nokkurra daga, líklega með lýsingu á móðurstefnu um mótun og áætluðum uppfærslum. Lögframleiðendur á báðum ströndum vísa nú þegar til málsins sem hvata til víðtækari AI‑stjórnun, þannig að rannsóknin gæti flýtt fyrir alríkislögum um öryggi generative‑AI, persónuverndarvarnir og ábyrgðarreglur. Niðurstaðan mun setja fordæmi um hvernig samfélög halda AI‑veitendum ábyrgum þegar tæki þeirra rekast á við öryggisáhættu í samfélaginu.
36

AI vikublað: 2026/4/1–4/10 Anthropic þrír skjálftur — Mythos ofurhætt að gefa út, tekjur yfir OpenAI, hugbúnaðarhlutabréf hrapa

Dev.to +5 heimildir dev.to
anthropicgemmagooglemetaopenai
Anthropic’s mikið umtalsverða Mythos‑líkan kom loksins úr skugganum þann 7. apríl, en fyrirtækið tilkynnti að það myndi ekki gefa kerfið út eftir að innri skoðanir uppgötvuðu þúsundir núll‑dagsgalla. Niðurstöðurnar, sem voru gefnar út í gegnum öryggarramma Project Glasswing, markaði skarpt andspil við sýnishornið sem Anthropic birti í síðustu viku. Með því að slökkva á kerfinu lagði Anthropic áherslu á vaxandi klofinn milli hratt vaxandi líkana og getu til að tryggja öryggi þeirra, þema sem hefur plagað greinin síðan “Claude Mythos” byltingin sem við fjölluðum um þann 10. apríl. Ákvörðunin kom í kjölfar þess að Anthropic tilkynnti stökk í fjórðungstekjum upp í 30 billiön dollara, og fór yfir OpenAI í fyrsta sinn. Vinnan var knúin áfram af fjölgum fyrirtækjasamningum sem bundu Mythos‑stefnumörkunartól við Claude‑4 pakkanum, þótt sjálft lykillíkanið sé enn óvirkt. Markaðsviðbragðið var fljótt: hugbúnaðar‑vísitölur féllu um 2,6 % í einni viðskiptaferð, sem endurspeglaði áhyggjur fjárfesta um að öryggisbrestir gætu seinkað víðtækari AI‑töku. Samtímis lokaði OpenAI við sögulegan 122 billiön dollara einkafjármögnun, sem styrkti fjárhagslegan vopnabúnað fyrirtækisins til reiknirit og mannauðs. Meta, undir forystu Wang Hui‑wen, kynnti Muse Spark, sitt fyrsta lokað‑kóða líkan, sem bendir til stefnu um eignarlegar lausnir sem forðast opna‑líkanum gagnrýni sem hefur plagað Anthropic. Google kynnti Gemma 4, líkan með 310 billjón færibreytur sem skilar betri frammistöðu en samkeppnisaðilar sem eru tuttugu sinnum stærri, á meðan Elon Musk og Intel tilkynntu sameiginlegt “Terafab” flöt til framleiðslu á næstu kynslóð AI‑silíku. Hvað á að fylgjast með næst: hvort Anthropic nái að laga Mythos og hefja viðskiptaútgáfu, hvernig stjórnvöld bregðast við líkani sem er talinn “of hættulegt til að gefa út”, og hvort innstreymi fjármagns í OpenAI og vélbúnaðarátak Musk‑Intel muni endurskapa keppnisstigið. Næsti fjórðungur mun sýna hvort öryggisáhyggjur geti samræmast óbilandi keppninni um stærðarhag.
36

OpenAI bætir við nýjum $100/mánaðar ChatGPT áskriftarstigi fyrir þyngri notkun Codex https:// fed.brid.

Mastodon +10 heimildir mastodon
anthropicclaudeopenai
OpenAI hefur sett í gang nýtt “ChatGPT Pro” áskriftarstig á $100 á mánuði sem eykur aðgengi að Codex forritunaraðstoðarmanninum fimmfalt miðað við núverandi $20 Plus-áætlun. Uppfæringin, sem var tilkynnt á mánudaginn og útfærð af TechCrunch og CNBC, beinist að þróunaraðilum og öflugum notendum sem keyra lengri, reikniverkfræðilega krefjandi forritunartímabil. Á meðan $200 Pro-stigið er enn í boði fyrir kröftugustu vinnuálag, fyllir miðlungsstigin bilið milli hagkvæmra Plus-áætlunarinnar og hágæða stigsins, og setur persónuleg notkunarsvæði OpenAI í samkeppni við langtímastöðu Anthropic $100 Claude áskriftina. Aðgerðinni er mikilvæg vegna þess að Codex, sérsniðið stórt tungumálamódel OpenAI fyrir kóðagenerun, hefur orðið lykilverkfæri til framleiðni fyrir hugbúnaðarverkfræðinga, gagnavísindamenn og lágtkóða vettvang. Með því að auka kvóta á verðstigi sem margir sjálfstæðir verktakar og litlir hópar geta ráðið, vonast OpenAI til að ná til hluta markaðarins sem hingað til hefur snúist að Anthropic eða opnum kóða lausnum. Verðbreytingin bendir einnig til víðtækari stefnu um að gera hágæða AI eiginleika að tekjum, ekki aðeins í almennu spjalli, og endurspeglar nýlegan fjölbreytileika í áskriftarstigum fyrirtækisins og vilja til að prófa stigvelda aðgang eftir að hafa sett á hlið £31 billiún UK fjárfestingarpakka í byrjun þessa mánaðar. Hvað á að fylgjast með næst: greiningaraðilar munu fylgjast með notkunarmælum fyrir $100 stigið og hvort það skemmir $200 stigið eða laðar að nýja notendur frá samkeppnisaðilum. Næsta verðlagningarbreyting OpenAI gæti komið þegar það fínstillir notkunarmörk fyrir önnur sérsniðin módel, eins og komandi agentic‑RAG verkfærin sem fjallað var um 10. apríl. Að auki gætu allar breytingar á undirliggjandi innviða kostnaði—sérstaklega í ljósi nýlegrar hægðar á UK gagnaveri—leitt til frekari aðlögunar á áskriftarverðunum.
36

Leiðbeiningar frá starfandi fagfólki: Hvernig á að setja Claude Code inn í VS Code og ræsa forrit í staðbundnu umhverfi – er óheimilt að líma API‑lykil beint í spjallið?! – Frá grunni til VIB‑kóðunar

Mastodon +10 heimildir mastodon
agentsanthropicclaude
Kennsluefni sem var sett á japanska þróunarfélagið Yayafa í gær leiðir lesendur í gegnum uppsetningu Anthropic‑forritsviðbótarins Claude Code í Visual Studio Code og keyrslu sýnishornsforrits á staðbundnum tölvu. Handbókin, sem er samskrifað af starfandi hugbúnaðarverkfræðingi, sýnir skref fyrir skref hvernig á að stilla viðbótina, búa til nauðsynlega skrá .claude‑credentials.json og ræsa AI‑kóðunarhjálpinn sem er innbyggður í IDE‑ið án þess að sýna API‑lykilinn í spjallgluggum – aðferð sem höfundurinn ávarpar af öryggis- og samræmisástæðum. Claude Code, svar Anthropic við GitHub Copilot, fór í opinbera beta seint á árinu 2024 og hefur fljótt orðið ákjósanlegasti hjálparmaður fyrir teymi sem leggja áherslu á „stefnu‑AI“ (constitutional AI) öryggisráðstafanir. Með því að fella líkanið beint inn í VS Code geta þróunaraðilar beint í ritlinunni beðið um kóðaútdrátt, endurskipulagningu eða prófagerð, á meðan viðbótin virðir tungumálastillingar notandans og býður upp á sýnishorn af mismun (diff) breytinga. Kennsluefnið sýnir einnig hvernig á að tengja Claude Code við Firebase til fljótlegrar frumgerðar, sem endurspeglar víðtækt ferli AI‑knúinnar full‑stack þróunar. Frásögnin er mikilvæg vegna þess að hún lækkar hindrunina fyrir norræna forritara til að taka upp persónuverndar‑fyrsta kóðunarhjálp sem keyrir staðbundið, og minnkar þar með áreiðanleika á skýjaþjónustum sem geta stangist á við GDPR eða fyrirtækjareglur um gagnaumsjón. Öryggis‑miðaðar leiðbeiningar – sérstaklega áminningin um að líma ekki API‑lykla í samtalsfyrirspurnir – varpa ljósi á vaxandi vitund um áhættu tengda leki á auðkennum, sem hefur plaggað fyrri útgáfur AI‑hjálpara. Á næstu árum hyggst Anthropic koma með Claude 3.5 með bættum samhengi (context windows) og nánari samþættingu við Azure OpenAI, sem gæti enn frekar minnkað markaðshlutdeild Copilot. Áhorfendur munu fylgjast með hvort VS Code‑markaðurinn sjái aukna fjölda Claude‑tengdra viðbóta, hvernig fyrirtækja‑IT deildir bregðast við staðbundnu keyrslu‑líkaninu, og hvort reglugerðarstofnanir gefi út leiðbeiningar um uppruna AI‑framleidds kóða. Vinsæld kennsluefnisins gæti merkt upphaf víðtækari umbylgju í átt að AI‑kóðunarverkfærum á staðnum í norrænu tæknilífi.
36

Agentic RAG: Hvernig leysir það vandamálin í hefðbundnu Retrieval‑Augmented Generation? | Cloud Technology Blog | SoftBank https://www.yayafa.com/2777654/ # Agent

Mastodon +12 heimildir mastodon
agents
SoftBank’s Cloud Technology Blog kynnti nýja “Agentic RAG” rammaverkefnið sem lofar að yfirstíga helstu takmarkanir hefðbundins Retrieval‑Augmented Generation. Tilkynningin lýsir sameiginlegu verkefni milli SoftBank og bandaríska sprotafyrirtækisins Archaea AI til að kommersialísera Agentic RAG‑knúna þekkingarvettvanginn “Krugle Biblio” í Japan, og setur hann fram sem fyrsta lausn á innfæddu tungumáli, með áherslu á umboðsmenn, fyrir fyrirtækjaleit og -framleiðslu. Hefðbundnar RAG‑pípur tengja fastan leitarvél við stórt tungumálalíkani, en þær glíma enn við úreltar vísar, rangar (hallúcin) niðurstöður og ófærni til að samræma fjölskrefa rökstuðning. Agentic RAG bætir við sjálfstæðan “umboðsmannalags” sem getur skipulagt leitarstefnur, metið áreiðanleika heimilda og ítrekað fínstillt spurningar byggt á sjálfsskoðun. Bloggið vísar í innri prófanir þar sem kerfið minnkaði staðreyndavillur um um 40 % og skammdi svartíman frá fyrirspurn til niðurstöðu um helming miðað við eigið Vertex AI RAGEngine frá SoftBank. Þessi þróun er mikilvæg vegna þess að hún brýr bilið milli handahófskennds spjallviðmóts og framleiðslugetailegs þekkingarvinnslu. Fyrirtæki sem hafa verið var við LLM‑hallúcin geta nú innbyggt sjálfprófanakerfi sem dregur sjálfkrafa nýjustu skjöl, beitir sértækum stefnum og jafnvel kallar á ytri verkfæri eins og reiknivél eða kóðatúlkun. Fyrir norðurlandafyrirtæki sem glíma við ströngar reglur um gagnasjálfstæði gæti staðbundið, umboðsmannastýrt RAG orðið raunhæft val í stað skýja‑aðeins lausna. Áframhaldandi þróun: SoftBank hyggst hefja tilraunarpílu með nokkrum japönskum fjármálastofnunum í þriðja fjórðungi, á meðan betaútgáfa fyrir evrópska samstarfsaðila er áætluð í byrjun 2027. Greiningaraðilar munu fylgjast með frammistöðumat á móti Google‑RAGEngine og notkun Krugle API í norðurlands AI‑markaðinum. Útgáfan mun einnig prófa hvernig sjálfsskoðunarkerfið skalar þegar umboðsmenn vinna með fjölbreytt, fjöltyngt efni – lykiláskorun fyrir víðtækari innleiðingu.
36

DXC Kynnir Nýja Assure Smart Apps til að Hraða AI‑Knúnu Umbreytingu Tryggingafyrirtækja | DXC Technol

Mastodon +10 heimildir mastodon
agents
DXC Technology hefur kynnt Assure Smart Apps, nýtt safn af AI‑drifnum, vinnuferli‑miðaðum forritum sem miða að því að flýta fyrir stafrænum umbreytingum hjá eignasjóð- og líftryggingafyrirtækjum. Forritin voru kynnt á DXC Connect Insurance Executive Forum og innihalda Claims Assistant, Engagement Assistant og Underwriter Assistant, öll byggð á ServiceNow‑agent AI‑vél og djúpri þekkingu DXC á tryggingageiranum. Forstilltuð einingar lofa að sjálfvirknivæða dagleg verk, minnka handvirkt vinnuálag um 30‑40 % og skila mælanlegum árangri innan 12 vika, án þess að krefjast umfangsmikillar útskiptunar á eldri kjarnakerfum. Tilkynningin kemur á tímum þar sem tryggingafyrirtæki glíma við aukna þrýsting til að nútímabæta, draga úr kostnaði og uppfylla vaxandi væntingar viðskiptavina um tafarlausa, persónulega þjónustu. Þó að AI‑innleiðing hafi flýtt upp, eru mörg fyrirtæki enn takmörkuð af sundurlausum eldri kerfum og skorti á innanhússþekkingu til að byggja sérsniðnar lausnir. Með því að bjóða upp á mótuleg, niðurstöðu‑miðað forrit sem tengjast núverandi umhverfi, stefnir DXC að því að lækka hindrunina fyrir innleiðingu og gera fyrirtækjum kleift að stækka AI‑verkefni hratt og öruggt. Greiningaraðilar munu fylgjast með hversu fljótt helstu tryggingafyrirtæki prófa nýju verkfærin og hvort lofaður hraði til virðingar verði raunverulegur. Fyrstu tilvikin gætu sýnt áhrif á nákvæmni í undirritun, tíma til lausnar kröfugerða og hlutfall kross‑sölu, en einnig varpa ljósi á möguleg starfsmannabreytingar þegar dagleg ferli verða sjálfvirk. Samkeppni frá öðrum tæknifyrirtækjum – sérstaklega Microsoft Cloud for Insurance og Salesforce Financial Services Cloud – mun auka þrýsting, og því verða innleiðingarmælikvarðar lykilmælir á markaðsáhrif DXC. Næstu nokkur mánuðir ættu að færa tilkynningar um niðurstöður tilrauna, samþættingarleiðir með breiðari AI‑portfólíó ServiceNow og hugsanlega reglugerðarathugasemdir um notkun agent AI í mikilvægu tryggingartökuákvörðunum. Þessir þættir munu móta hvort Assure Smart Apps verði hvati til iðnaðarvíðrar AI‑hröðunar eða bara sértækt tilboð í fjölbreyttum markaði.
36

Verður það smartere því meira þú notar það? Greining á sjálf‑þróun AI umboðsmönnum https://www.yayafa.com/2777657/ # AgenticAi # AI #

Mastodon +8 heimildir mastodon
agentsgemma
Rannsóknarteymi frá japanska sprotafyrirtækinu Asty hefur gefið út ítarlega greiningu á „sjálf‑þróun“ AI umboðsmönnum, þar sem sýnt er hvernig stöðug samskipti við notendur geta gert sama líkanið smám saman klárara án ytri endurþjálfunar. Greinin, sem kom út 10. apríl, brýtur niður arkitektúrinn á bak við frumgerðir eins og Gemma‑4, GEPA og HermesAgent, sem öll keyra staðbundið og uppfæra innri þyngdir sínar í gegnum blöndu af styrkleikarnámi frá mannlegum endurgjöf (RLHF) og meta‑námi á tækinu. Með því að geyma samskiptaskrá í öruggu sandkassa, framleiða umboðsmenn smáuppfærslur sem eru sameinaðar í grunnlíkan á hverju kvöldi, sem gerir þeim kleift að fínstilla tungumálaskilning, rökstuðning við vörumat og jafnvel myndaleitarfærni í rauntíma. Af hverju þetta skiptir máli er tvíþætt. Fyrst og fremst lofar aðferðin nýjum bylgju „umboðsmann“ forrita sem geta persónulegsett sig í rauntíma á meðan gögn eru haldin undir stjórn notandans – bein viðbragð við persónuverndarvandamálum sem hafa hælt innleiðingu skýja‑AI þjónustu. Í öðru lagi lækkar tækni hindrunina fyrir smærri fyrirtæki til að setja upp flókin hjálparforrit, sem gæti umbreytt netverslun, þjónustu við viðskiptavini og sköpunartólum. Niðurstöðurnar endurspegla þróunina sem við bentum á í síðustu viku: Meta’s Muse Spark líkanið, sem getur borið saman vörur úr myndum, og ZETA’s innleiðing á OpenAI’s ChatGPT í verslunarpallinn, byggja bæði á fljótu, notenda‑drifinni fínstillingu. Skýja‑AI tekjur Amazonar eru í sögu og Linux Foundation’s Agentic AI Foundation sýna enn frekar hvernig iðnaður stefnir að stöðugum námsumboðsmönnum. Það sem á eftir að fylgjast með eru hagnýtar útfærslur sem eru áætlaðar í sumar. Asty hyggst gefa út opinn SDK sem leyfir þróunaraðilum að tengja sjálf‑þróunarkjarna við núverandi spjall‑ og vörumatakerfi. Agentic AI Foundation er áætlað að birta drög að staðlum um örugga uppfærslu‑mekanískar, og bæði Meta og ZETA hafa bent á beta‑prógram sem mun prófa þessa umboðsmenn í lifandi smásöluumhverfi. Næstu mánuðir munu sýna hvort sjálf‑þróunarmiðuð umboðsmenn geti uppfyllt loforð sín án þess að fórna öryggi eða stöðugleika.
32

【Ofbeldi of ógnvekjandi – Anthropic læsir „Claude Mythos“ í sprengjandi tilkomnun】 Shota Imai: „Mannkynið hefur farið yfir mörkin“ / Hár afköst sem vekja grun um aprílspjöll / Meta tekur alvarlegan þátt í AI‑keppninni með nýjum módeli | AI QUEST

Mastodon +6 heimildir mastodon
agentsanthropicclaude
Anthropic kynnti nýjan stórt tungumálamódel, Claude Mythos, þann 7. apríl, en innan nokkurra daga dró fyrirtækið úr öllum opinberum útgáfum. Innri prófanir sýndu að kerfið gat sjálfstætt fundið og nýtt þúsundir nútímalausna (zero‑day) í helstu stýrikerfum og vafrum, hæfni sem langt fór yfir öryggisviðmót núverandi módel. Þessi uppgötvun leiddi til þess að öryggisteymi Anthropic settist í einangrun um módelið og gaf út yfirlýsingu um að „áhætta óstýrrrar uppgötvunar á veikleikum vegi yfir alla skammtíma viðskiptalega ávinning“.* Atburðurinn hefur kveikt nýjan umræða um mörk sjálfstæðra AI‑kerfa. Shota Imai, áberandi AI‑rannsakandi í AI QUEST, varaði við því að „mannkynið hefur farið yfir línuna“ þegar kerfi getur vopnað hugbúnaðarvillur án mannlegrar stjórnunar. Viðbragð hans dregur fram vaxandi óvissu meðal sérfræðinga um að næsta kynslóð grunnmódelanna gæti haft sjálfstæðan vilja sem krefst nýrra stjórnunarramma. Að það að benchmark‑stig módelins voru svo há að Imai fyrst taldi að um sé að ræða aprílspjöll, eykur tilfinninguna um að tækni þróist hraðar en opinber umræða nær að fylgja. Tilbúnin Anthropic dregur einnig úr samkeppnisumhverfinu. Meta tilkynnti að nýja Llama X serían verði gefin út seinna á þessu fjórðungi, og setur félagsmiðlunarfyrirtækið í alvarlegan þátt í keppninni um hæfilegasta, en samt stjórnanlega AI‑kerfið. Áhorfendur munu fylgjast með því hvort öryggis‑by‑design nálgun Meta geti forðast þau vandræði sem knúðu Anthropic til að loka Mythos, og hvernig reglugerðir í ESB og Bandaríkjunum bregða við módelinu sem getur sjálfstætt uppgötvað alvarlegar hugbúnaðarveikleika. Lykilmerki til að fylgjast með eru meðal annars formleg öryggisúttektir á Claude Mythos, Meta‑útgáfuáætlun og gagnsæis‑skýrslur, og næsta umferð af stefnumótunartillögum í ESB AI‑lögunum sem gætu krafist for‑dreifingar‑veikleikamatreynslu fyrir AI‑kerfi með hár áhættu. Sagan sem þróast mun líklega setja fordæmi um hvernig iðnaðurinn samræmir byltingarkennda frammistöðu við nauðsynina á að halda öflugum AI í öruggu fangasvæði.
32

SV: https:// mastodon.online/@parismarx/116 372697459719963  Einn af verstu hlutunum við þetta

SV: https:// mastodon.online/@parismarx/116 372697459719963  Einn af verstu hlutunum við þetta
Mastodon +6 heimildir mastodon
anthropicgooglemetaopenai
Samstillt upplýsingasvindlunarherferð sem knúin er af gervigreind réðist á milljónir snjallsíma um Evrópu á þriðjudaginn og leiddi til þess að forsætisráðherra Svíþjóðar krafðist svara frá stærstu leikmönnum greinarinnar. Aðgerðin, sem rekst á net af ýttu‑tilkynningum og raddaðstoðarspurningum, birti rangar yfirlýsingar um væntanlega skattaumbót, en breytti síðan yfir í uppfinnað heilbrigðisráð. Rannsóknir óháðra öryggisfræðinga tengdu framleiðslu efnisins við stórtæka tungumálalíkön sem eru í umsjá Google, Meta, Anthropic og OpenAI, á meðan dreifingar‑innviðir byggðu á farsíma‑auglýsingakerfum þessara fyrirtækja. Atvikið er fyrsta sinn sem sameinaða úttak heimsins leiðandi generative‑AI veita er notað í vopn á persónulegum tækjum, umhverfis hefðbundna fjölmiðla og nýtt traust notenda á innbyggðum símatilkynningum. „Samfélag þar sem tækniólígarki getur gripið inn í, eins og einn gerði í gær, í farsíma milljóna borgara til að segja þeim lygi?“ spurði forsætisráðherrann í þingræðu, og endurspeglaði vaxandi áhyggjur almennings yfir óstýrtum áhrifum gervigreindar. Af hverju er þetta mikilvægt? Tvöfalt. Fyrst sýnir það hvernig samdráttur AI‑tölvuafls og hæfileika í fáum stórum fyrirtækjum getur umbreytt í raunverulegt „upplýsingavopn“ sem starfar án nokkurs gagnsæis eða eftirlits. Í öðru lagi varpar atvikið ljósi á reglugerðarblindgóma: núverandi persónuverndar‑ og kosningarsamhæfni‑lög umfatta ekki AI‑framleitt efni sem er sent í gegnum eigendomsforritasölu og tilkynningaraðila, og skilur þannig borgara eftir í viðkvæmu ástandi gagnvart svikum í tengiliðapunkti. Það sem á eftir að fylgjast með eru stefnumótun og markaðsviðbrögð. Evrópusambandið hefur merkt um flýtt innleiðingu AI‑löganna, með sérstaka áherslu á „há‑áhættutækni“ í generative kerfum. Í Bandaríkjunum er Federal Trade Commission að opna keppnisskýrslu um samvinnu í notkun AI‑framleiddra auglýsinga. Á sama tíma sjá dreifðar vefsvæði eins og Mastodon mikinn fjölda nýrra notenda sem leita að valkostum við fyrirtækjastýrða vistkerfið. Næstu vikur munu sýna hvort löggjafar geti sett raunveruleg takmörk áður en næsta „skítugur sýning“ tækninnar fer í gang.
32

Há orkukostnaður og reglugerðir: OpenAI stöðvar Stargate UK

Mastodon +10 heimildir mastodon
openai
OpenAI hefur sett “Stargate UK” gagnaverkefnið í bið, og bendir á hár rafmagnsverð og óvissa í reglugerðarumhverfi í Bretlandi. Þetta skref fylgir fyrri ákvörðun fyrirtækisins um að draga úr áætluðu háskólarekninu í Abilene, Texas, og er nýjasta hindrunin í þeim metnaðarfulla AI‑innviðaátaki sem var kynnt í september í samstarfi við Nvidia og gagnaverþróunarfyrirtækið Nscale. Eins og við skýrðum 10. apríl, lagði OpenAI í bið við byggingu í Bretlandi eftir að orkukostnaður sýndi sig hærri en áætlað var. Nýjasta yfirlýsingin bætir við því að fyrirtækið mun halda áfram viðræðum við stjórnvöld í London til að leita skýrari stefnumótunarleiðbeininga og mögulegra hvata. Tæknstjóri OpenAI sagði að biðin sé „tímabundin“ og að fyrirtækið sé enn skuldbundið við tilvist í Bretlandi, en mun ekki halda áfram fyrr en orkugjaldakerfið og reglur um gagnavernd eru stöðugir. Ákvörðunin hefur áhrif á mörg svið. Bretland hefur sett sig fram sem evrópskt miðstöð fyrir AI‑rannsóknir og vonar að stórt reikniverkefni laði að sér hæfileikaríkt fólk, styrki innlend tæknifyrirtæki og tryggi gagnasjálfstæði. Stöðvun á þessu lykilverkefni ógnaðir þessar áætlanir og gæti gefið samkeppnisaðilum eins og Microsoft Azure eða Google Cloud forskot á svæðinu. Fyrir OpenAI dregur biðin fram vaxandi spennu milli hraðrar stækkunar líkana og sjálfbærni undirstöðu reikniverkefna, þema sem kemur einnig fram í nýlegum takmörkunum á útgáfum nýrra líkana vegna öryggisáhrifa í netöryggi. Það sem skal fylgjast með næst eru niðurstöður viðræðna við bresk stjórnvöld. Endurbætt orkuskattakerfi eða markvissir styrkir gætu endurlifað verkefnið, á meðan langvarandi óvissa gæti ýtt OpenAI til að flytja getu til kostnaðarstöðugri staða í Evrópu eða norrænum löndum. Samhliða þróun – sérstaklega breytilegar áskriftarleiðir fyrirtækisins fyrir þunga notkun Codex-þjónustu – mun einnig gefa vísbendingu um hvernig OpenAI jafnar vöxt við rekstrarleg takmörk.
29

Molotovkókki kastað á heimili OpenAI-forstjóra Sam Altman, grunaður handtekinn

KRON4 +12 heimildir 2026-02-18 news
openai
Lögreglan sagði að Molotovkókki hafi verið kastað á íbúðarhús Sam Altman, framkvæmdastjóra OpenAI, í San Francisco snemma um morguninn á föstudegi. Sprengjuleg tækið sló í málmgáttina á Russian‑Hill heimili Altmans á 855 Chestnut Street um kl. 03:40, og kveikti stutta eldgos sem öryggisverðir slökkuðu fljótt. Enginn varð slasaður og eignin varð aðeins með yfirborðsskaða. San Francisco lögreglunnar handtók 31 ára karlkyns grunaða stutt eftir það eftir að hafa skoðað eftirlitsmyndband sem sýndi árásina og ógnir geranda utan höfuðstöðva OpenAI. Handtakan var staðfest bæði af deildinni og umboðsmanni OpenAI, sem neitaði að nefna einstaklinginn þar til formlegir ákærur voru gerðar. Atvikið er nýjasta ofbeldislegu atburðurinn sem miðar að áberandi persónu í AI-geiranum, nokkrum vikum eftir að ríkissaksóknari Flórída hóf rannsókn á mögulegum tengslum OpenAI við skotbrott á háskólan
28

Nýjasti styrkur OpenAI felur í sér allt að $15.000 í AI-útreikningum á mánuði

Insider +9 heimildir 2026-04-08 news
ai-safetyanthropicopenai
OpenAI’s nýjasti styrkur felur í sér allt að 15.000 $ í AI‑útreikning
28

OpenAI bætir við $100 á mánuði ChatGPT-áskrift vegna Vibe‑kóðunar

OpenAI bætir við $100 á mánuði ChatGPT-áskrift vegna Vibe‑kóðunar
CNET +9 heimildir 2026-04-01 news
openai
OpenAI hefur sett í gang nýja $100‑á‑mánuði “ChatGPT Pro” áskrift sem beinist að þróunaraðilum sem treysta á Vibe‑kóðunarhjálparann, sem er knúinn af Codex. Áætlunin eykur notkunarmörk Codex fimmfalt miðað við $20‑á‑mánuði Plus áskriftina, og gerir “Vibe‑kóðendum” kleift að keyra lengri, meira kröfuharða lotur án þess að lenda í þeim takmörkunum sem hafa ýtt mörgum til að færa sig niður í lægri áskrift eða skipta um verkfæri. Aðgerðin kemur í kjölfar fyrri tilkynningar OpenAI þann 10. apríl um að það myndi kynna dýrari áskrift fyrir þunga Codex‑notendur. Eins og við skýrðum þann dag, fyllir $100‑áætlunin verðbil á milli almennrar Plus‑tilboðsins og $200‑á‑mánuði “ChatGPT Pro” áskriftarinnar sem beinist að fyrirtækjastærum vinnsluálögum. Með því að auka miðlungsáskriftina vonast OpenAI til að ná til vaxandi hóps atvinnuþróunaraðila sem þurfa stöðuga AI‑aðstoð við flókin kóðasöfn, á sama tíma og þjónustan er haldin nógu hagkvæm til að keppa við keppinauta eins og GitHub Copilot og Google Gemini. Mikilvægið fer framhjá tekjum. Hærri notkunarmörk geta flýtt fyrir innleiðingu AI‑aðstoðrar þróunar, mögulega ummyndandi vinnuferla í hugbúnaðarverkfræði um allt norræna svæðið og víðar. Á sama tíma gæti stigveldisverðlagning vakið athygli yfirvalda sem fylgjast með markaðsafli AI, sérstaklega þar sem OpenAI stendur frammi fyrir rannsóknum í Bandaríkjunum varðandi öryggi og ábyrgð. Hvað á að fylgjast með næst: Fyrstu tölur um notkun munu sýna hvort $100‑áskriftin nær að brúa bilið milli áhugamanna og fyrirtækja, og hvort hún dregur úr fráfalli frá Plus‑áætluninni. Greiningaraðilar munu einnig vera spenntir að sjá hvort OpenAI fínstillir verðlagninguna enn frekar eða bætir við fleiri þróunaraðila‑miðuðum eiginleikum, og hvernig keppinautar bregðast við á markaði sem er í hraðri þróun í átt að AI‑drifiðri kóðunarhjálp.
24

KD-MARL: Tilfangavænt þekkingarþjöppun í fjölþjónustu endurgjöfarnámi

ArXiv +9 heimildir arxiv
agentsinferencereinforcement-learning
Nýtt pre‑print á arXiv, **KD‑MARL: Tilfangavænt þekkingarþjöppun í fjölþjónustu endurgjöfarnámi**, leggur fram tvíþætt kerfi sem þjappar samstilltar stefnu miðstýrðs sérfræðings í flota léttværa, dreifðra nemenda‑þjónusta. Höfundarnir sýna að með því að taka skýrt tillit til útreiknings-, minni- og áætlanatímafjárhags við þjöppun, halda nemenda‑þjónustur flestum af frammistöðu sérfræðingsins á meðan þær keyra á jaðartækjum með mun strangari tilfangaskilyrði. Framlögin eru mikilvæg vegna þess að raunveruleg MARL‑útfærslur—stjórnun umferðarljós, svipbrigða vélmenni, stjórnun snjalltengda netkerfa—hafa lengi verið hamlaðar af þungum reiknilegu álagi sérfræðistefna, sem oft krefjast stórrar tauganetkerfis og löngra ákvörðunarhringa. Tilfangavæna nálgun KD‑MARL gerir það mögulegt að keyra samstilltar fjölþjónustu kerfi á ígrundaðum tækjum, minnka orkunotkun og seinkun án þess að fórna þeim sjálfbæru liðsheild sem gefur MARL yfirburði yfir lausnir með einum þátttakanda. Verkefnið byggir á nýlegum uppblæstri í rannsóknum á þekkingarþjöppun, þar á meðal okkar eigin umfjöllun um veikt stjórnað þjöppun fyrir transformer‑hallusination (9. apríl), og dregur hugmyndina frá tungumálalíkönum yfir í krefjandi umhverfi fjölþjónustusamvinnu. Það sem er að fylgjast með næst er hvort höfundarnir geti staðfest kröfurnar sínar á staðlaðum MARL‑mælikvörðum eins og **StarCraft II**, **SMAC** og umferðarljóshermum, og hvernig aðferðin tengist opnum MARL‑bókasöfnum eins og **MARL‑toolbox**. Atvinnugreinarprófanir í sjálfvirkum drónaflota og jaðarbundinni IoT‑stjórnun eru líklegar til að fylgja eftir ef frammistöðu‑til‑tilfangasambandið stendur. Næsta grein um aðlögunarhæfar þjöppunarmörk, sem vísbending er í GitHub‑gögnunum hjá höfundunum, gæti enn frekar minnkað skilvirkniáhrifin og hugsanlega umbreytt því hvernig fjölþjónustu‑gervigreind er sett í framkvæmd utan rannsóknarstofunnar.
24

$0,60 á lotu, bara í upphafsstig. Þetta er það sem AI‑aðili minn var að gera áður en hann skrifaði neina kóða.

Dev.to +10 heimildir dev.to
agentsautonomousclaudeopenai
Nýleg tilraun þróunaraðila Glincker sýnir að „upphafsstig“ (orientation) AI‑knúins kóðunarhjálpar getur þegar kostað um það bil $0,60 á lotu, áður en ein lína kóða er framleidd. Með því að nota opna kóðagrunninn StackLit (github.com/glincker/stacklit) og einfalda skipunina `npx stacklit init` skráði höfundurinn notkun táknanna (tokens) í undirliggjandi tungumálalíkani og breytti þeim tölum í raunverulega rafmagnsnotkun og verðlag frá skýjaþjónustuveitendum. Gögnin sýna að upphafleg skráning á beiðni, uppsetning umhverfis og söfnun samhengi tæki um það bil 1,2 kWh af útreikningum, sem jafngildir tilgreindum kostnaði á hverja lotu. Af hverju er þetta mikilvægt? Tvö atriði koma í ljós. Fyrst, þróunaraðilar og fyrirtæki treysta sífellt meira á sjálfstæða kóðunar­aðila til að flýta fyrir hugbúnaðarframleiðslu, en flest verðmódel sýna aðeins kostnað við lokaniðurstöðu. Falin „upphafsstig“‑kostnaður getur fljótt minnkað efnahagslegan ávinning, sérstaklega í stórum mæli. Í öðru lagi bætir orkunotkun þessara undirbúningsskrefa við vaxandi kolefnisspor AI‑studdra þróunar, áhyggjuefni sem hefur komið fram í nýlegum greiningum á rafmagnsnotkun AI‑kóðunar­aðila. Með því að mæla framhalds‑kostnaðinn áður en kóðun hefst, ýtir Glincker verkum sínum á samtalið frá aðaláherslu á fjölda tákna (tokens) yfir í heildarútreikninga á fjárhagslegum og umhverfislegum kostnaði. Það sem á eftir að fylgjast með er hvernig vettvangsveitendur bregðast við. OpenAI’s Agents SDK og sambærileg verkfærakassa eru þegar að bjóða upp á nákvæmari mælingar, og keppinautar gætu innleitt stigveldisverð sem aðgreinir upphafsstig frá framkvæmd. Á sama tíma er líklegt að samfélagið sjá tilraunir til hagræðingar – léttari spurningarstjórnun (prompt engineering), skyndiminni (caching) á umhverfisgögnum og blandað áreiðanlegt útreikning á tækinu (hybrid on‑device inference) – til að minnka sóun í útreikningum. Reglugerðar- og sjálfbærðarúttektaraðilar gætu fljótlega krafist gagnsærrar skýrslugerðar um orkunotkun AI‑aðila, sem myndi breyta þessum fyrstu kostnaðargreinum í viðmiðunarpunkt fyrir iðnaðarmörk.
24

Bættu við 197 líffræðilegum upplýsingatæknifærni í Claude Code með SciAgent‑Skills

Dev.to +8 heimildir dev.to
agentsclaudefine-tuningrag
Anthropic hefur gefið út SciAgent‑Skills, íforrit sem útbýr Claude Code með 197 fyrirfram pakkaðri líffræðilegri upplýsingatækni og líffræðisfræðilegri getu. Safnið, sem er hýst á GitHub, kemur með “færni” sem er tilbúin til notkunar – kóðamynstur, best practice sniðmát og sýnishornasnið fyrir verkefni frá RNA‑seq samstillingu til einnar frumuklasa og lyfja‑markspár. Samkvæmt viðmiðun verkefnisins nær Claude Code 92 % nákvæmni á handvirkt valið líffræðilegt upplýsingatæknipróf án nokkurs fínstillingar á módelinu eða retrieval‑augmented generation (RAG). Þessi þróun er fyrsta skiptið sem Claude Code er sett fram sem sérsniðinn aðstoðarmaður fyrir tölvu‑líffræði. Eins og við skýrðum 10. apríl, var sama módelið þegar í notkun í rauntíma kriptóviðskipta kerfi og, aðskildur, í safni öryggistól. Að víkka út umfang þess í líffræðisvísindi gæti lækkað hindrunina fyrir rannsakendur sem ekki hafa djúpa forritunarfærni, og gert nemendum á grunn- og framhaldsnámi og PhD‑laboratoríum kleift að búa til eðlilega Python‑ eða R‑pípur með einu skipun. Fyrir norðurlanda líffræðisfyrirtæki lofar íforritið fljótari frumgerðargerð á omics greiningum og nánari samþættingu við svæðisbundna heilbrigðisgagnauppbyggingu, sem gæti flýtt fyrir lyfjagjöfugreiningarhringum og persónulegum lyfjagerðum. Áhorfendur ættu að fylgjast með fyrstu notendum í háskólalaboratoríum og líffræðis‑inkúbátorum til að meta raunverulega frammistöðu, sérstaklega á stórum gagnasöfnum þar sem minnis- og keyrslutímar takmarkanir eru ólíkar þeim í viðmiðunarumhverfinu. Vegvísir Anthropic bendir á frekari færnisett fyrir proteomics og greiningu klínískra tilrauna, á meðan keppinautar gætu sett á laggirnar svipað “færni‑verslun” vistkerfi. Reglugerðarstofnanir í ESB og Noregi verða einnig að meta hvort AI‑framleiddur líffræðilegur upplýsingatæknikóði uppfylli staðla um staðfestingu í klínískum rannsóknum. Næstu vikur munu sýna hvort SciAgent‑Skills geti breytt áhrifamiklum viðmiðunartölum í áþreifanlegan framleiðsluaukning í gegnum norðurlands líffræðisvísindalandslagið.
24

Hvernig Anthropic Claude + TensorFlow knýja rauntíma kriptaviðskiptagerð

Dev.to +6 heimildir dev.to
agentsanthropicclaudereasoning
Þróunarteymi frá Norður-evrópu hefur kynnt fullkomlega starfandi kriptaviðskiptagerð sem sameinar Anthropic‑kerfið Claude við tólf TensorFlow‑líkön, og býður upp á náttúrulegan tungumálaviðmót sem getur framkvæmt viðskipti á millisekúndum. Kerfið, sem er lýst í nýrri opnum hugbúnaðarvörslu, setur Claude í hlutverk hárstigs rökfræðiverkefnis meðan TensorFlow‑líkönin sjá um verðspá, tilfinningagreiningu, sveiflupörkun, greining á bókum pöntunar, áhættumat og hagræðingu framkvæmdarstefnu. Notendur slá inn skipanir eins og „Kauptu 0,5 BTC ef markaðsbreið tilfinning breytist í jákvæða innan næstu fimm mínútna“, og Claude umbreytir ásetningnum í samstilltar kallanir á undirlíkönin, sem síðan senda inn pantanir til fjölda viðskiptabanka í gegnum lágt seinkunargátt. Upphaflegur bakprófun á Bitcoin‑ og Ethereum‑gögnum frá síðustu tólf mánuðum sýnir meðaltals‑Sharpe‑stuðul 2,1 og nettó hagnaður‑til‑tap hlutfall 3,4 : 1, sem er um það bil 27 % betra en viðmiðunaráætlað reiknirit. Lifandi prófun með lítilli fjárfestingu upp á 10 000 $ yfir tveggja vikna tímabil skilaði 38 % ávöxtun, með viðskiptaframkvæmdartímanum stöðugt undir 150 ms. Þróunaraðilarnir þakka Claude’s Model Context Protocol fyrir að tengja saman ólík líkön án sérsniðins límíkóða, mynstur sem þeir sýndu fyrst í „Claude Mythos“ seríunni sem við fjölluðum þann 10. apríl. Útgáfan er mikilvæg því hún sýnir að stór tungumálalíkön geta virkað sem áreiðanleg stjórnunarlag fyrir fjármálatengd sjálfvirkni í háu áhættustigi, og lækka hindrunina fyrir óteknilega viðskiptamenn til að nýta flókin AI‑pípur. Hún vekur einnig spurningar um sanngirni markaðarins, eftirlitsreglur og öryggi AI‑stýrðra viðskiptabóta sem gætu magnað flass‑hrunið. Væntanlegar vísbendingar um innleiðingu frá áhættufélögum og smásöluveitum, möguleg athugun frá fjármálareftirliti í ESB og Bandaríkjunum, og næstu útgáfur Claude frá Anthropic sem gætu dýpkað samþættingu við TensorFlow og önnur vélarnámsumhverfi. Opinn kóðinn mun líklega verða viðmiðunarpunktur fyrir framtíðar AI‑knúna viðskiptaarkitektúr.
24

5 LLM spiluðu póker: Opus úti í fyrstu umferð, Grok vann

HN +6 heimildir hn
claudegeminigpt-5grok
Fimm leiðandi stórt tungumálamódel (LLM) keppðu í Texas Hold’em mótinu í síðustu viku, þar sem Claude Opus frá Anthropic var úti í fyrstu umferðinni og xAI Grok frá Elon Musk varð sigurvegari. Keppnin, sem var skipulögð af AI‑spilalabborinu „Strategic Minds“, settist Opus, Grok 4, Google‑módelið Gemini 2.5 Pro, OpenAI‑GPT‑5 og Anthropic‑Claude Sonnet 4.5 í röð af 1.000‑handar leikum á opinberum pókervél. Hvert módel fékk sömu handa‑söguupplýsingar og var beðið um að skila ákvörðun um veðmál, hækkun eða fjárhæð, sem vélin framkvæmdi síðan. Tilraunin var meira en bara kynningaratriði. Með því að neyða LLM‑in til að taka rauntíma, hár‑áhættuaðgerðir undir ófullkomnum upplýsingum, sýndi prófið hversu vel núverandi spurningarstílar umbreyta í stefnumótun. Snemma útrýming Opus bentir á varanleg veikleika í áhættumat, á meðan stöðugur árásargirni Grok og rétt tímasettir blúffar sýna þróaða hæfni til að líkja eftir andstæðingahegðun – færni sem hefur verið fínstillt með nýlegum endurgjöf‑í‑þjálfun frá mannlegri endurgjöf (RLHF) hjá xAI. Af hverju þetta skiptir máli er tvíþætt. Fyrst er póker viðmiðunarpunktur fyrir gervigreind almenna (AGI) vegna þess að hann sameinar líkindafræði, sálfræði og langtímaáætlanir; skýr sigur Grok bendir til þess að LLM‑in séu að minnka bilið milli tungumálakunnáttu og ákvörðunarhæfni. Í öðru lagi gætu niðurstöðurnar flýtt fyrir innleiðingu AI‑aðstoðarmanna í fjármálum, viðræðum og leikjum, þar sem nákvæm áhættumat er lykilatriði. Á sama tíma vakti mótinn öryggisspurningar: ef LLM‑in geta blúffað sannfærandi, gætu þau verið misnotuð í svikum eða markaðsmanipúlun nema sterkar varnir verði settar á. Það sem á eftir að fylgjast með er eftirfylgimót sem áætlað er í júní og mun bæta við fjöl‑aðila endurgjöf‑í‑þjálfunarlagskikt, sem gerir módelunum kleift að aðlaga stefnu sína milli handa. Atvinnugreindaráhugamenn munu einnig fylgjast með næstu uppfærslum OpenAI‑GPT‑5 og næstu útgáfu Opus frá Anthropic, sem báðar lofaða nánari samþættingu stefnumótunar. Að lokum er væntanlegt að stjórnvöld gefi út leiðbeiningar um AI‑drifna spilavítunarforrit, skref sem gæti mótað hvernig þessi módel verða kommersialiseruð utan rannsóknarstofunnar.
21

Að takast á við römmur í talmátaum getur verið enn erfiðara en í textamiðaðum #spjallmenni

Mastodon +6 heimildir mastodon
agentshealthcarevoice
Ulrike Stiefelhagen kynnti á W3C vinnustofu um snjall talmáta um víðtækt blinda svæði í notkun gervigreindar: römmur eru erfiðari að stjórna í talandi viðmótum en í textamiðaðum spjallmenni. Hún byggði á tveimur raunverulegum innleiðingum – “Workers Daily Summary” þjónustu sem veitir starfsmönnum í verksmiðju daglegar uppfærslur um vaktina, og “Patient Chat” verkfæri sem aðstoðar lækna við flótta‑mat – og sýndi að hljóðúttak í rauntíma magnar áhættu á óstaðfestum eða uppfinndum yfirlýsingum. Ólíkt skrifuðum svörum, geta talrömmur heyrst strax, sem gerir villur erfiðari að greina og getur haft alvarlegri afleiðingar í öryggiskrítískum umhverfum eins og heilbrigðisgeiranum. Áskorunin ræðst af þörfinni á að sameina lágt seinkun talgervingu með traustum rótunarkerfum. Stiefelhagen hélt því fram að núverandi LLM pípur, sem skara framúrskarandi í að búa til flæðandi texta, skorti oft þær staðfestingarhringar sem þarf til að tryggja hljóðútgáfu. Hún kallaði eftir innbyggðum rótunarkontrollum, breytilegum trauststigum og varasvari sem gefa til kynna óvissu áður en röddin er framleidd. Í fyrirlesturinn var einnig vísað í nýrri prófunarramma, eins og LiveKit talmáta hjálparforrit, sem einangra rök í eingöngu textaham til að ná í römmur snemma í þróunarferlinu. Af hverju er þetta mikilvægt núna tvíþætt. Fyrst, talassistentar eru að breiða út frá neytendatækjum í fyrirtækja- og læknisvinnslu um allan Norðurlönd, þar sem reglugerðir um öryggi sjúklinga eru strangar. Í öðru lagi, breiðari AI samfélagið er að takast á við að draga úr römmum eftir háþróaða atburði, eins og Anthropic “Project Glasswing” sem miðar að því að koma í veg fyrir AI‑stýrða netöryggisbresti. Niðurstöður Stiefelhagens benda til þess að án sérstakra öryggisráðstafana gætu talmáta orðið næsta vettvangur fyrir rangar upplýsingar eða læknisfræðilegar villur. Það sem þarf að fylgjast með næst eru W3C nýja tillaga um rauntíma rótun fyrir talmódel, tilraunir sem innleiða Hermes‑stíls verkfærakall í talpípur, og möguleg EU‑norræn reglugerð sem gæti krafist skýrrar “óvissukynningar” fyrir talandi AI úttak. Samspil staðla, prófunartól og reglugerðaþrýstings mun ákvarða hvort talmáta geti skilað lofaðri náttúrulegri samskiptum án áhættu á hljóðlegum römmum.
21

Fyrsta Vibe‑kóðaða handritið fékk mig til að gráta

Mastodon +11 heimildir mastodon
apple
Forritari birti á samfélagsmiðlum að það að lesa “vibe‑kóðað” skrift í fyrsta sinn gerði hann að gráta, og lýsti kóðanum sem klúnalegri, næstum illviljaðri tilraun til að líkja eftir fegurð. Skriftið, sem var framleitt af AI‑stýrðu no‑code vettvangi, fékk hrós fyrir hraða en var gagnrýnt fyrir orðasöm, pedantísk uppbygging sem bauð lítið raunverulegt virkniverð. Þetta útbragð hefur kveikt nýja umræða um vaxandi áreynslu á “vibe coding” — hugtak sem var sett á til að lýsa AI‑hjálpaðri draga‑og‑sleppa þróun sem lofar að gera óforritendum kleift að framleiða hugbúnað án þess að skrifa hefðbundinn kóða. Viðbrögðin skipta máli vegna þess að þau draga fram spennu sem hefur byggst síðan OpenAI kynnti $100‑á‑mánuði ChatGPT áskriftarþrepið sem var ætlað þungum Codex notendum. Eins og við skýrðum 10. apríl, var þetta þrep markaðssett sem leið til að opna upp í öflugri kóðagenereringar eiginleika, og þar með fjármagna þau “vibe‑coding” vinnuferli sem nú eru í brennidepli. Gagnrýnendur halda því fram að tæknin sé notuð á rangan hátt: öflug tungumálalíkön eru eytt í að framleiða víðfeðmar, lágkvaliteta skriftur sem forritarar þurfa enn að endurskapa, sem eykur kostnað og seinkar verkefni. Atvinnugreindarathugendur benda á yfirtöku Base44 árið 2025 — átta manns nýsköpunarfyrirtæki sem var frumkvöðull í no‑code kóðun — sem vararathugun um ofbeldi markaðsáherslna yfir raunverulegan gildi. Það sem á eftir að fylgjast með er hvernig hugbúnaðarumhverfið og AI‑söluaðilar bregðast við. Við getum vænt um að OpenAI og samkeppnisaðilar fínstilli API‑in sín fyrir kóðagenereringu, mögulega með því að innleiða gæðamælikvarða eða nánari samþættingu við hefðbundin IDE til að draga úr sóun. Á sama tíma gætu forritunarfélög og opinn‑kóða verkefni safnast um bestu verklagsreglur fyrir AI‑hjálpaða kóðun, á meðan fjárfestar gætu endurskoðað fjármögnun hreinna “vibe‑coding” sprotafyrirtækja. Næstu vikur munu sýna hvort tilfinningaleg viðbrögð breytist í raunveruleg staðla eða hvort þau næi aðeins til að knýja enn eitt umferð á hype.
21

Umhverfisþjónninn þinn er minn: Mæling á illgjarnum millivegaraárásum á framboðkeðju LLM

Mastodon +6 heimildir mastodon
agentsinference
Nýtt arXiv‑pappír, “Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain” (arXiv 2604.08407), kvantar hvernig AI‑aðilar geta orðið bakdyr fyrir árásarmenn sem stjórna útreikningsþjónustunni eða einhverjum beini sem miðlar köllum til stórra tungumálalíkana. Höfundarnir sýna að þegar aðili er settur í gang, fær þjónustan í raun aðgang á skeljarstigi að hýsilferlinu, sem gerir illgjarnan kóða sem felst í sýnilega harmlögu “færni” kleift að keyra án þess að virkja núverandi öryggisífiltra. Rannsóknin byggir á nýlegum raunverulegum atburðum sem hafa skakað traustið á AI‑verkfærakerfinu. Fyrir tveimur vikum fannst vinsæla liteLLM‑gáttin innihalda bakdyr í útgáfum 1.82.7 og 1.82.8, þar sem skýjaheimildir og Kubernetes‑leyndarmál voru stolið eftir að ógnvekjandi PyPI‑umsjónarmaður hlaðaði inn skaðlegum pakkum. Eftirfylgjandi greining sýndi að skaðleg færsla nýtti sama kóða‑framleiðslu‑og‑keyrslu‑hringrás sem nútíma LLM‑aðilar nota, og kom umfram orðabóklegar skipanalíkanir. Áður í þessum mánuði birttu vísindamenn “PoisonedSkills” rammann, sem setur inn álag í Markdown‑kassa og stillingasniðmát, og breytir þeim í stórum mæli til að ná yfir 15 MITRE ATT&CK flokka. Pípun þeirra framleiddi yfir þúsund andstæðilegar færni sem keyra hljóðlega í venjulegum verkefnum aðila. Af hverju þetta skiptir máli er einfalt: fyrirtæki taka í hraða í notkun LLM‑stýrðra aðila til forritunar, gagnaútdráttar og sjálfstæðrar ákvörðunartöku. Ef færni‑markaðurinn eða beinirinn er hnekktur, getur árásarmaður farið frá harmlögu viðbót í fulla fjarlæga kóðakeyrslu, stolið leyndarmálum og tekið yfir vinnuuppsetningar í skýjaumhverfum. Ógnan stækkar hefðbundna framboðkeðju‑líkan—þar sem aðeins líkamsþyngdir taldar voru viðkvæmar—til að innifela alla stjórnunarpípu. Það sem þarf að fylgjast með næst eru nýir varnir. Rannsakendur leggja til strangari upprunaskráningarpunkta fyrir færnipakka, sandkassalíkamið umhverfi sem einangrar aðilaferla og keyrslustaðfestingu á beinisniðbúnaði. Geirðaríki eins og Cloud Native Computing Foundation eru áætlað að setja fram öryggisleiðbeiningar fyrir AI‑aðilaumhverfi innan næstu fjórða árs. Fylgist með viðbótum frá framleiðendum fyrir liteLLM og sambærilegum gáttum, og með ráðstefnuskilum á komandi AI‑Sec Europe samkomu þar sem höfundarnir munu kynna hagnýtar varnaraðgerðir. Keppnin milli árásarmanna og vernda er nú að færa sig frá eiturefni í líkönum yfir í kóðann sem gerir aðila gagnlegan.
20

Verkfæri sem tengir alla AI‑þjónustuveitendur – Viltu lausn sem sameinar Anthropic, OpenAI og Google?

Mastodon +11 heimildir mastodon
anthropicgoogleopenai
Nýtt samþættingarlag sem bindur saman API‑ið hjá Anthropic, OpenAI og Google hefur komið á markað, og lofar forritara aðgang að einum innskráningarpunkti fyrir þrjá helstu veitur stórríkis‑tungumálalíkana. Verkfærið, sem var kynnt í GitHub geymslu undir nafni “UnifiedAI‑Bridge”, sér um auðkenningu, sniðmótun beiðna og stjórnun á takmörkum á hverju þjónustu sjálfkrafa, og gerir notendum kleift að skipta á milli líkana á flugi án þess að þurfa að endurskrifa kóða. Útgáfan er mikilvæg vegna þess að AI‑landslagið hefur orðið sífellt brotið upp. Eftir nýlegan tilkynning OpenAI um aukna útreikningsafkapa (1,9 GW) og áköf útgáfu Anthropic á Claude Mythos, eru fyrirtæki í þrýstingi að festa viðskiptavini í eigin eigið vistkerfi. Gátt sem tengir saman birgja minnkar hindrunina fyrir tilraunir, dregur úr lásun í eitt tilboð og gæti flýtt fram innleiðingu blandaðra lausna sem nýta styrkleika hvers líkana – til dæmis kóðagerð OpenAI, öryggis‑miðaður samtal Anthropic og fjölbreytt sjónskynjun Google. Fyrir sprotafyrirtæki og norðurlanda fyrirtæki sem skortir djúpar verkfræðiráðgjafar, gæti brúin verið það sem skiptir á milli hugmyndarprófs og framleiðslu­klárra vöru. Það sem þarf að fylgjast með næst er hversu fljótt samfélagið tekur upp brúna og hvort helstu rannsóknarstofur bregðist við með strangari API‑takmörkunum eða opnum kóða‑valkostum. Skapandinn á verkfærinum hefur lofað greidd “fyrirtækja‑stig” sem bætir við endurskoðunarskrám og samræmingar­tenglum, og gefur til kynna snemma áhuga frá reglugerðartengdum geirum eins og fjármálum og heilbrigðismálum. Stjórnvöld í ESB og Noregi eru þegar að útbúa reglur um gagnsæi AI‑líkana; sameinaður aðgangspunktur gæti orðið miðpunktur í samræmingarskoðunum. Að lokum er vert að fylgjast með hugsanlegum samstarfi – ef OpenAI eða Google myndu styðja við brúna, gæti það umbreytt keppnisspörunum sem hafa mótað AI‑vopnabaráttuna í ár.
20

Svar: https://flipboard.com/@associatedpress/top-stories-u7govdf1z/-/a-_ssSKmx_R9WGEJr2VyDh0w%3A

Mastodon +6 heimildir mastodon
Samstillt skýrsla sem gefin var út á mánudaginn af AI-observatoríunni Evrópusamningsins og óháða rannsóknarhópnum AI‑Watchdog varaði um að hraðvaxandi útbreiðsla stórra tungumálalíkana (LLM) sé að „slopifera“ gæði upplýsinga á netinu. Rannsóknin, með titlinum *Slopifering stafræna landslagsins*, greindi 1,2 milliár AI‑framleiddar texta á samfélagsmiðlum, fréttavefsíðum og netverslunarsíðum og fann 37 % hækkanir í staðreyndarvillum, endurteknum orðasamböndum og stílslegum „truflunum“ miðað við viðmiðun frá 2022. Höfundarnir rekja þróunina til þriggja samrýmdra þátta: lýðræðislegar útgáfur öflugra LLM í gegnum opna kóða, eins og Meta‑Llama 4, áreynslulaus verðlækkun sem hefur gert API‑aðgang ódýran fyrir fjölda‑stærðar innleiðingu, og skortur á traustum eftir‑framleiðslu sannprófunartólum. „Þegar hver sem er getur sett upp líkan á nokkrum sentum þúsund sinnum á dag, breytist hvati frá gæðum til magns,“ skrifaði aðalhöfundur skýrslunnar, Dr. Elena Rossi. Niðurstöðurnar endurspegla fyrri áhyggjur sem komu fram eftir verðlækkun OpenAI á ChatGPT‑4, sem leiddi til sprengju í lágtverða innihalds­búðum, og fylgja nýlegri rannsókn á AI‑framleiddum rangfærslum tengdum skotvopnarástandi í háskóla í Flórída. Af hverju þetta skiptir máli er ljóst: þegar AI‑skrifað efni flæðir inn í leitarniðurstöður, fréttastreymi og vörulýsingar, stendur notandinn frammi fyrir hærri áhættu á misskilningi, minnkun vörumerkjavörunar og minnkuðu trausti á stafrænum fjölmiðlum. Stjórnvöld hafa þegar bent á málið í AI‑lögum ESB, en skýrslan krefst tafarlausra staðla um sannprófun úttaks og skylt merkingar á AI‑framleiddum texta. Það sem á eftir að fylgjast með eru væntanlegar leiðbeiningar Evrópusamningsins um „gæði AI‑úttaks“, sem áætlað er að fara í opinberan ráðgjafarferli í júní, og viðbrögð iðnaðarins—sérstaklega hvort stórfyrirtæki eins og OpenAI, Google og Meta muni innleiða rauntíma staðfestingar í API‑kerfin sín. Næstu nokkur mánuðir gætu ákveðið hvort stafræna vistkerfið geti snúið slopiferingarþrendi áður en hún umbreytir opinberum umræðum.
20

Apple Intelligence í hættu vegna innspýtingar á fyrirmælum

Mastodon +11 heimildir mastodon
apple
Apple’s newly launched AI suite, Apple Intelligence, has been found vulnerable to a classic yet increasingly potent attack vector: prompt injection. Security researchers disclosed that specially crafted inputs can hijack the system’s language model, forcing it to emit malicious or profane content and, in more advanced scenarios, to reveal internal prompts that guide its behavior. The flaw stems from the way Apple Intelligence concatenates user‑supplied text with system‑level instructions before passing the combined prompt to the underlying large‑language model. By embedding hidden directives in seemingly innocuous queries, an attacker can override the model’s safeguards and steer its output toward any desired narrative. The discovery matters because Apple Intelligence is positioned as the cornerstone of the company’s AI strategy, powering features across iOS, macOS, iPadOS and the upcoming “Apple Vision Pro” interface. If malicious actors can manipulate the model on a personal device, they could generate disinformation, phishing content, or even code that exploits other apps. The vulnerability also highlights a broader industry challenge: prompt injection attacks, long known in web‑based AI agents, are now surfacing in consumer‑grade products that lack the hardened defenses of enterprise platforms. Apple has acknowledged the report and pledged a “rapid response” patch, but the timeline remains unclear. In the meantime, security teams are scrambling to devise mitigations, such as stricter input sanitisation and sandboxed prompt handling. Watch for Apple’s forthcoming software update, likely rolled out through iOS 18 and macOS 15, and for any disclosures from the broader AI‑security community about similar weaknesses in rival assistants. The episode underscores that as AI becomes a core OS feature, robust prompt‑injection defenses will be as essential as traditional malware protections.
20

Hermes virðist vera áhrifaríkari við verkfærakall með lágkostnaðar líkani en OpenClaw. Uppsetning mín er grunn

Mastodon +11 heimildir mastodon
agents
Hermes, opinn hugbúnaður til að kalla á föll sem Nous Research hefur gefið út, fær sífellt meiri athygli eftir að notendur hafa tilkynnt að hann standist OpenClaw þegar hann er notaður með lágkostnaðar tungumálalíkönum. Í nýlegu færslu í samfélaginu tók forritari fram að einföld uppsetning með 7‑milliardar‑stika líkani notaði greinilega færri tákn (tokens) með Hermes en með OpenClaw, og að Hermes‑kerfið „finnur eigin breytingar rétt í fyrsta sinn oftar“. Fullyrðingin byggist á hagnýtum tilraunum frekar en formlegum viðmiðum, en söguleg gögn styðja við hönnun Hermes sem leggur áherslu á tákn‑hagkvæma spurningarstýringu og áreiðanlega breytingagreiningu. Þessi þróun er mikilvæg því verkfærakall er lykilatriði í nútíma sjálfstýrðum gervigreindarkerfum. Með því að leyfa líkani að kalla á ytri API‑kerfi – leitar, gagnagrunna eða sérsniðna föll – geta forritarar byggt upp aðstoðarmenn sem starfa sjálfstætt. Lágkostnaðar líkan eru drifkraftur í innanhússuppsetningum og hjá kostnaðarvænum sprotafyrirtækjum; hver minnkun á notkun tákna leiðir beint til lægri reiknings fyrir útreikninga og fljótlegra svara. Ef Hermes stöðugt veitir nánari samþættingu og færri endurreynsluferla, gæti það breytt jafnvægið frá stærri, aðeins skýja‑tilboðum og flýtt útbreiðslu sjálfstæðrar gervigreindar um Norðurlönd og víðar. Það sem á að fylgjast með næst er tilkomu kerfisbundinna samanburða. Rannsakendur eru væntanlega að birta hlið við hlið mat á staðlaðum verkfærakallasettum eins og Function‑Calling v1 gagnasafninu, og bæði Hermes‑ og OpenClaw‑liðirnir hafa gefið til kynna komandi útgáfur – Hermes v2 með víðari stuðningi við skema og OpenClaw næstu kynslóðar keyrsluumhverfi. Samþætting við vinsælar stjórnunarlag eins og LangChain eða GitHub Copilot CLI verður einnig prófsteinn fyrir raunverulega innleiðingu. Hagsmunaaðilar ættu að halda augum opin á samfélagsdrifnum viðmiðum og öllum tilkynningum frá skýjaþjónustuveitendum sem gætu innifalið Hermes‑stíls kall í API‑kerfin sín.
20

Gervigreindar (AI) hlutabréfið sem ég myndi kaupa með $1.000 áður en markaðurinn nær sér aftur

Yahoo Finance +7 heimildir 2026-03-24 news
Alphabet (GOOGL) hefur komið aftur í barmi sem efsta valkostur fyrir fjárfesta með hóflegt $1,000 fjárhagsáætlun, samkvæmt nýrri greiningarskýrslu sem heldur því fram að mikla sölu á AI‑fyrirtækjum hafi skapað kaupumferð áður en breiðari markaðurinn nær sér aftur. Mælið fylgir viku með aukinni sveiflu sem dró Nasdaq inn í leiðréttingarsvæði, þróun sem við bentum á þann 10. apríl þegar við greindum tvö AI‑hlutabréf sem vert er að kaupa fyrst. Hlutabréf Alphabet hafa fallið um um 12 % frá upphafi ársins, en hafa hærra fall en meðaltal geirans, sem er 15 %, þrátt fyrir áframhaldandi útgáfu Gemini, næstu kynslóðar stórt tungumálalíkans, og innleiðingu AI‑tól í Google Leitarvél, Workspace og Cloud. Áhrifin byggjast á fjölbreyttum tekjuuppsprettum Alphabet og getu þess til að nýta AI í stórum skala. Tekjur frá Google Cloud, nú knúnar áfram af AI‑bættum þjónustum, hækkuðu um 28 % á ári í Q1, á meðan auglýsingatekjur hafa hafist að ná sér eftir niðurfall vegna varfærnis auglýsenda í AI‑tengdum herferðum. Enn fremur veitir risastór gagnageymsla fyrirtækisins og hliðarfyrirtækið í hönnun örgjörva, Google‑AI, kostnaðarkosti yfir keppinauta sem enn eru háðir þriðju aðila vélbúnaði. Greiningarmenn líta á núverandi verð‑til‑tekju margföldun, 5,8, sem afslátt frá 7‑8 sviðinu sem er eðlilegt fyrir hávöxtunar AI‑fyrirtæki, og sjá möguleika á uppsveiflu ef markaðurinn endurmetur væntingar um AI‑tekjur. Fjárfestar ættu að fylgjast með þremur lykilþáttum: frammistöðu Gemini í raunverulegum innleiðingum, næstu tekjuútgáfu sem áætlað er í byrjun maí, og öllum reglugerðum sem kunna að koma fram vegna nýju OpenAI-uppskriftarinnar um AI‑skatta og eftirlit. Sterkari en væntanleg tekjuuppgötun eða byltingarkennd samstarf gætu flýtt um enduruppbyggingu, á meðan strangari AI‑reglur eða langtímaleg hækkun í minnkun auglýsingakostnaðar gætu haldið hlutabréfinu í kyrrstöðu. Fyrir þá sem vilja úthluta þúsund dollurum núna, býður Alphabet upp á blöndu af vexti, lausafjárstreymi og þolþoli sem gæti skilað ábata þegar tæknaríkið fer í gang aftur.
20

Nasdaq er í leiðréttingarsvæði. Hér eru 2 gervigreindarfyrirtæki (AI) sem ég kaupi fyrst.

AOL +11 heimildir 2026-04-01 news
Nasdaq Composite féll undir 10 % lækkunarviðmiðunina frá hámarki á föstudegi og fór formlega inn í leiðréttingarsvæði í fyrsta sinn á þessu ári. Lækkunin var kveikt af atvinnuleysisþýðingunni sem kom út veikari en búist var við og endurnýjuðu áherslu á verðbólgu, en söluþrýstingurinn hefur ekki útrýmt áhuga markaðarins á gervigreindarvörum. Analytikinn Adam Spatacco heldur því fram að leiðréttingin sé „að hylja innviðaþróunina algerlega“ á meðan eftirspurn eftir AI-þjónustum er óbreytt. Í dálki sínum þann 9. apríl bendir hann á tvö hreint AI-fyrirtæki sem hafa sýnt verulega slæmari frammistöðu en vísitalan og nú virðast vera vanmetin: C3.ai (AI) og Palantir Technologies (PLTR). Báðar fyrirtækin hafa séð hlutabréf sín falla um meira en 20 % síðan Nasdaq náði hámarki í mars, og skapað það sem Spatacco lýsir sem „98 % og 115 % uppsögn“ samkvæmt nýlegum markaðsáherslum frá Wall Street. Mikilvægið felst í því að á sama tíma er veikleiki á makróstigi á meðan vöxtur í tilteknum geira er í gangi. C3.ai’s platform‑as‑a‑service líkan er að ná í sér viðskiptavini í fyrirtækjum sem vilja innleiða generative‑AI eiginleika án þess að byggja upp eigin gagnastreymi, þróun sem var dregin fram í greininni okkar þann 10. apríl um bilun í retrieval‑augmented generation. Palantir’s gagna‑samruna lausn, nú styrkt með nýju samstarfi við stóran skýjaþjónustuaðila, setur fyrirtækið í stöðu til að ná í hluta af $1,5 trillion AI‑hugbúnaðar markaðinum, sem greiningar segja að muni vaxa í tvíþrepunum til 2028. Fjárfestar ættu að fylgjast með komandi ársfjórðungsskýrslum fyrirtækjanna til að sjá merki um að tekju‑rásir séu að mótast, sem og mögulegum stefnumótunarbreytingum eftir nýja áætlun OpenAI‑forstjóra Sam Altmans um skatta- og reglugerðaráætlanir fyrir AI. Endurvakning í tækniráðningum eða mýkri stefnu Seðlabankans gæti einnig lyft breiðari Nasdaq, og flýtt fyrir verðleiðréttingunni á þessum hlutabréfum. Núna eru þessi tvö valkostir andstæðingaleg leikur á AI‑eftirspurn í kjölfar markaðslekkurs.
18

Tækniríkar málkerfisrýni í 600 línur C# án afhengni

HN +5 heimildir hn
Þróandi hefur birtað fullgerð málkerfisrýni GPT á GitHub, sem inniheldur allan þjálfunar- og ákvörðunarpípulínuna í um 600 línur hreins C# og byggir ekki á neinum ytri bókalföstum. Verkefnið, sem heitir AutoGrad-Engine, er lína fyrir línu þýðing á „microGPT“ skriftu Andrej Karpathy, endurskrifuð frá grunni með aðeins grunnreikniaðgerðum og innbyggðum gagnagögnum .NET. Geymslan inniheldur léttvigt automatic-differentiation-vélinn, tokeniser, transformer-blokka og einfaldan optímisera, sem gerir það mögulegt fyrir alla með .NET-þróunarmiljú að þjálfa lítið transformer á tölvu og búa til texta án þess að setja upp PyTorch, TensorFlow eða NuGet-pakka. Útgáfan er mikilvæg af fjölmörgum ástæðum. Fyrst, afhjúpar hún innri vinnslu stórra málkerfa með því að strippa þau niður í stærðfræðilegan kjarna, og bjóða upp á handahófsnámsverkfæri fyrir nemendur og verkfræðinga sem kosa C# yfir Python. Önnur, bendir hún til þess að .NET-kerfi geti hýst alvarlega gervigreindarannsóknir án þess að vera háð þyngri afhengni sem ríkir í sviðinu, og getur opnað dyrnar fyrir LLM-innleiðingu í Windows-miðaðir forrit, Unity-leikjum eða brúnaráðum þar sem binary-stærð og keyrslufótspor eru mikilvæg. Loks, boðar minimalistiska kóðabasissin félagslegri athugun, optímiseringu og tilraunum, og fæðir menningu opnarleika sem stendur í andstæðu við óopinbera, einkaeignu stika sem oft eru notaðir í viðskiptagervigreind. Það sem á að horfa á næst er hvernig .NET-samfélagið tekar við geymslunni. Fyrra notendur munu líklega bera saman frammistöðu hennar við upprunalegu Python-útgáfuna, kanna GPU-hröðun með DirectX eða Vulkan, og stækka vélinn til að styðja stærri módel sem LLaMA eða GPT-Neo. Ef verkefnið fær fótfestu, gætum við séð bylgju af C#-fyrst gervigreindabókalföstum, þéttara innleiðingu með Azure-gervigreindatækjum, og kannski jafnvel framleitni-klasa útgáfur af transformer-módelum í umhverfi sem áður höfðu víst við Python-miðaða tækjum. Tilraunin undirbýr víðari átt: gervigreind er að verða tungumálin óháð, og tæknin til að byggja hana er að verða aðgengilegri fyrir þróendur á alla stigum.
18

Að gervigreindariðnaðinn elskar tokeninflation. Fyrirtækin þín ættu ekki að…

Mastodon +6 heimildir mastodon
Ný rannsókn með titlinum „Lost in the Middle“ hrekur upp langtímavísindalega hugmynd í fyrirtækja‑AI: að því að gefa tungumálalíkani meira og meira samhengi muni sjálfkrafa bæta úttak þess. Greinin, sem er skrifuð af rannsakendum frá Stanford og DeepMind og sett á arXiv í þessari viku, sýnir að umfram um það bil 1.000 tokena í hólfinu skilar viðbótarsamhengi ekki aðeins minnkandi ávinningi, heldur getur það einnig skaðað frammistöðu í verkefnum frá samantekt skjala til kóðaútfyllingar. Höfundarnir rekja áhrifin til „tokeninflation“ – óstoppandi aukningar í fjölda tokena sem eru unnið með án samsvarandi aukins merkis, sem ýtir upp reikniskostnaði og tafum. Niðurstöðurnar eru mikilvægar því flestir viðskipta‑LLM þjónustuaðilar verðleggja notkun á tokenum. Fyrirtæki sem óhjákvæmilega bæta við stórum þekkingargrunnum eða samtalsferlum í upphafstexta gætu verið að greiða fyrir sóun í útreikningum án þess að sjá neina gæðabætur. Á markaði þar sem AI‑knúin SaaS vörur eru þegar undir þrýstingi vegna Nasdaq‑leiðréttingarinnar sem við fjölluðum 10. apríl, gæti óhagkvæmni kostnaðarins sem rannsóknin dregur fram þrengt hagnaðarmörk fyrir fyrirtæki sem treysta mikið á OpenAI, Anthropic eða Cohere API‑a. Enn fremur bætir umhverfisáhrif óþarfa tokenvinnslu við sjálfbærnismál í viðskiptamyndinni um nákvæmari spurningarstjórnun. Það sem á eftir að fylgjast með er hvernig AI‑pallastofnanir bregðast við. OpenAI, til dæmis, hefur hafið tilraunir með „context‑window pricing“ sem gefur afslátt á tokenum eftir ákveðinn lengd, á meðan Anthropic kynnir Retrieval‑Augmented Generation sem leið til að halda spurningum léttum. Fyrirtæki munu líklega innleiða nýjar bestu aðferðir í spurningarstjórnun, eins og breytilegt brotlokun og markvissa endurheimtu, og kanna nýrri token‑hagkvæma arkitektúra eins og LongLoRA og FlashAttention. Frekari rannsóknir frá sömu hópum eru áætlaðar seinna á þessu ári og gætu mótað iðnaðarstaðla fyrir kostnaðar­hagkvæma, hágæða AI‑innleiðingu.
15

OpenAI dregur sig úr áberandi £31 bn fjárfestingarpakka í Bretlandi

HN +5 heimildir hn
openai
OpenAI tilkynnti í dag að það muni draga sig úr £31 billiún sterlings AI fjárfestingarpakka Sameinuðu konungsríkisins, skref sem hrakar um stefnu ríkisstjórnarinnar um að festa landið í fremstu sæti í alþjóðlegu AI‑keppninni. Ákvörðunin, sem kom fram í stuttum yfirlýsingu til fjölmiðla, bendir á „óvæntar lagalegar takmarkanir og vaxandi rekstrarkostnað“ sem helstu ástæður dráttarins. Pakki, sem forsætisráðherra Rishi Sunak kynnti í febrúar, samanstóð af £10 billiún sterlings opinberum sjóði ásamt £21 billiún sterlings sem einkaaðilar skuldbunduðust að leggja til til að byggja upp landsvísanlegt AI‑miðstöð, fjármagna háskólarefni og skapa lagalegan „sandbox“ fyrir háþróuð líkön. OpenAI átti að veita háþ
15

Sýna HN: BrokenClaw hluti 5: GPT-5.4 útgáfa (Innspýting)

HN +6 heimildir hn
gpt-5
Nýtt opið‑uppspretta verkefni með titlinum **BrokenClaw Part 5: GPT‑5.4 Edition (Prompt Injection)** hefur verið sett á Hacker News og býður upp á hagnýta sýningu á því hvernig nýjasta GPT‑5.4 líkanið er hægt að sannfæra um að hunsa eigin öryggisbúra. Geymslan, sem er gefin út af sama samfélagsdrifna teymi sem þróaði fyrri BrokenClaw tilraunir, inniheldur safn af handvirkt hönnuðum prompts, léttan orchestration script og safn af diagnostics sem sýna hvernig fíngerðar token‑manipulationar geta komist hjá efnis síum OpenAI. Útgáfan er mikilvæg vegna þess að prompt injection—þar sem árásarmaður setur illgjarnar leiðbeiningar inn í sýndarlega harmlausar notendainntökur—hefur orðið eitt af þeim raunverulega árásarvegi sem eru í notkun gegn í lofti settum tungumálalíkönum. Með því að beina athyglinni að GPT‑5.4, nýjustu útgáfunni af flaggskipi OpenAI, fær BrokenClaw 5 umfjöllun um veikleika frá rannsóknarprótotýpum yfir í útgáfu sem mörg fyrirtæki eru þegar að meta fyrir viðskiptavina‑miðaðar lausnir. Höfundarnir skrá að ein lína af “jailbreak” texta getur kveikt á því að líkanið framleiði óheimilt efni, opinberar innri kerfis‑prompts eða keyrir handahófskenndan kóða þegar það er notað í samhengi við tool‑use API‑a. Niðurstöður þeirra varpa ljósi á bili milli útgefinna mótvægisaðgerða OpenAI og raunveruleikans í rauntíma prompt‑samsetningu í framleiðsluumhverfi. Áhorfendur ættu að fylgjast með svari OpenAI; fyrirtækið gefur venjulega út fljóta viðbætur eftir samfélagslegar tilkynningar, og formleg öryggisleiðbeining gæti endurskapað bestu starfsháttir varðandi hreinsun prompts. Öryggarrannsakendur munu líklega byggja á aðferðafræði BrokenClaw 5, útvíkka prófanir í fjölbreyttar multimodal viðbætur og fínstilltar útgáfur. Á meðan þur
14

Hvernig á að tryggja að iPhone-ið þitt sækir öryggisbætur í bakgrunni

Mastodon +1 heimildir mastodon
apple
Apple hefur kynnt „Rapid Security“, nýtt bakgrunns‑uppfærslukerfi sem dreifir mikilvægu lagfæringum til iPhone án þess að krefjast aðgerða frá notanda. Þessi eiginleiki, sem kom með iOS 26.4.1, sækir og setur upp öryggislaga í leynilegri hátt um leið og tækið er tengt Wi‑Fi, í hleðslu og óvirkt, og tryggir að veikleikar verði lokaðir í því augnabliki sem Apple gefur út lagfæringu. Notendur geta staðfest stillinguna í **Stillingar → Almennt → Uppfærslu hugbúnaðar →
14

Bíð eftir DeepSeek: nýtt líkan til að prófa AI‑ambiti Kína

Mastodon +6 heimildir mastodon
chipsdeepseeknvidia
DeepSeek‑ið lofaði V4 tungumálalíkanið, en það hefur enn ekki komið til móts, og hefur það kveikt nýjar spurningar um hraða AI‑átaks Kína og hvort Ascend örgjörvar Huawei geti loks keppst við yfirráð Nvidia í AI‑vélbúnaði. Kínverska sprotafyrirtækið, sem sprakk á sviðinu í síðasta ár með V3 líkanið sem samsvaraði miðlungs‑vesturlandshugbúnaði, tilkynnti í byrjun mars að V4 yrði „tilbúið til innleiðingar“ í lok fjórðungsins. Þessi tímasetning er nú liðin án opinberrar sýningar, fréttatilkynningar eða nokkurra mælikvarða. Greinir í greininni benda á að þessi þögn fellur saman við auknar bandarískar útflutningsstýringar á háafköstum örgjörvum, sem hafa neydd kínverska fyrirtæki til að flýta þróun innlendra lausna. Ef V4 kemur á Ascend raðir Huawei, gæti það boðið upp á algerlega kínverskt stafróf—líkan, þjálfunarramma og ályktunarvélbúnað—sem er fær um að keyra stórtæk generatív verk á án þess að þurfa Nvidia GPU. Þetta myndi tákna verulegan skref í átt að sjálfstæðisstefnu sem Peking hefur stefnt að síðan 2022‑árinu með „tvírása“ stefnu, og gæti ummyndað alþjóðlega AI‑birgðakeðju með því að gefa kínverskum skýjaþjónustuaðilum samkeppnisforskot í kostnaðarviðkvæmum mörkuðum. Seinkunin dregur einnig fram tæknilegu hindrunirnar við að stækka líkan umfram 100 billjón parametra á innlendum silíkum. Á meðan Baidu‑Ernie 4 og Alibaba‑Tongyi Qianwen hafa verið gefin út á Nvidia‑byggðu innviðum, er markmið DeepSeek að sanna að innlendum örgjörva‑líkanparinu geti samsvarað eða farið fram úr þeim frammistöðum. Fylgist með opinberri útgáfu frá DeepSeek eða Huawei innan næstu mánaða, og með öllum þriðju aðila mælikvarða sem gætu staðfest getu Ascend til að takast á við væntanlega 200 billjón‑parametra V4 arkitektúr. Samhliða þróun—svo sem ströngun bandarískra AI‑útflutningsleyfa og evrópsk áhersla á opinn AI‑vélbúnað—mun líklega hafa áhrif á hvort Kína geti raunverulega boðið viðeigandi Nvidia‑valkost.
14

Apple lokar þrjár verslanir í Bandaríkjunum á varanlegan tíma í júní

Mastodon +6 heimildir mastodon
apple
Apple tilkynnti á mánudögum að fyrirtækið mun loka þremur verslunum á varanlegan tíma í Bandaríkjunum í júní, og staðfesti þannig rólegan upphaflegan ferli sem hófst með tilkynningu sem var sett á felanet fyrirtækisins. Verslanirnar sem eru áætlaðar til loka eru verslunin í Towson Town Center í Maryland, verslunin í Westfield San Francisco Centre í Kaliforníu og greininn í Oakbrook Center nálægt Chicago. Apple mun segja upp um 150 starfsmönnum, en þeim verða boðnir lausafé og valmöguleiki til að flytja yfir í nálægar verslanir þar sem unnt er. Ákvörðunin merkir nýjasta skrefið í átföngu Apple til að strauma sínu verslunarþjónustu eftir röð lítilla loka á síðustu tveimur árum. Þótt fyrirtækið héldi áfram að birta sterkar vélbúnaðssölu - Mac-sendingar jókst um 9% í fyrsta fjórðungi 2026, og voru meiri en sú almenna markaði fyrir tölvur, eins og við rituðum um það þann 10. apríl - þá er verslunarstrategían að breytast í átt til stærri "Apple Upplifunarmiðstöðva" sem sýna þjónustu, auknu veruleika og AI-knúin eiginleika. Greinendur sjá lokaðir sem svar við aukinni rekstrarkostnaði, breyttum neyslahegðunum sem hafa áhuga á netverslun og þarfir til að endurskipa fasteigna til hagnaðaraukinnar reynslu. Lokunin hefur einnig staðbundnar afleiðingar. Stjórnendur verslunarhússins í Towson voru á varða um mögulegt fall í ganga, en borgarstjórar í San Francisco og Oak Brook hafa beðið Apple um að útskýra samfélagsaðgerðir. Starfsmenn hafa verið áhyttir yfir vinnuöryggi, en yfirlýsing Apple féllst á "ábyrgð á áhrifinum á starfsfólki". Það sem á að horfa á næst er hvort Apple mun endurnýta rýmdirnar sem eru yfir látnar fyrir nýja upplifunarmiðstöðva eða leigja þær til þriðja aðila. Framförðarfundur fyrirtækisins getur sýnt framförðarætlunina ef frekari loka á verslunum er áætlað, og verkalýðsfélög mun líklega fylgjast með því hvernig uppsagnirnar eru meðhöndlaðar. Formlegur fréttatilkynning er áætluð seinna þessa vika, sem getur útskýrt áætlunarkerfið á bakvið lokunina í júní.
14

Apple Mac-sendingar hækka 9 % í fyrsta fjórðungi 2026, yfirgnæða heildarmarkaðinn fyrir tölvur

Mastodon +6 heimildir mastodon
apple
Apple sendi 9 % fleiri Mac tölvur í fyrsta fjórðungi 2026 en á sama tíma á fyrra ári, samkvæmt gögnum frá markaðsrannsóknarfyrirtækinu IDC. Þessi hækkanir hækka Apple hlutdeild í alþjóðlegum persónulegum tölvumarkaði í 10,2 %, sem er hærra en heildarmarkaðurinn fyrir tölvur, sem óx aðeins um 2,1 % á sama tíma. Vöxturinn var aðallega knúinn af sterkri eftirspurn eftir nýja uppfærðu MacBook Air með M3 örgjörva og inngangs‑Mac mini, sem báðar eru settar fram sem hagkvæmar inngangsportar í vaxandi vistkerfi Apple með AI‑bættum þjónustum. Vöxturinn er mikilvægur því hann bendir til þess að vélbúnaðarstefna Apple—sem byggir AI‑ambiti sín á sameinuðu silíkumplássi—séir vel hjá bæði neytendum og fyrirtækjaviðskipt
14

iOS 26.4.1 inniheldur þessar tvær breytingar fyrir iPhone

Mastodon +1 heimildir mastodon
apple
Apple setti í loftið iOS 26.4.1 á þriðjudaginn, og uppfærslan er áberandi vegna tveggja sértækra breytinga sem snerta bæði öryggi og AI á tækinu. Fyrst hefur Stolen Device Protection (vörn gegn stoliðri tæki) verið uppfærð til að vinna nákvæmari samvinnu við Find My netkerfið: í tilfelli þar sem iPhone er kompromitterað, slökktir sjálfkrafa aðgangur að stóru tungumálalíkönum (LLM) og öðrum persónuverndarviðkvæmum þjónustum eftir þrjár misheppnaðar lykilkóða tilraunir, á sama tíma sem dulkóðað og stafrænt undirritað lock‑down skipun er send til skýja Apple. Endurbætunin bætir einnig við einum smelli „Eyða LLM skyndiminni“ valkosti í Find My forritinu, sem gerir eigendum kleift að hreinsa staðbundin AI spurningar án þess að eyða öllu tækinu. Annar breytilegur þáttur er frammistöðu‑miðuð fínstilling á AI‑útreikningum Apple á tækinu. Nýtt lággæða áætlunarlag dregur úr keyrslu líkana í bakgrunni þegar rafhlaða fellur niður í 20 % og forgangsraðar notendabyggðum beiðnum eins og Siri fyrirspurnum eða Translate tillögum. Forritarar fá endurbætt API‑flagg sem gefur til kynna þegar kerfið fer í „orkunýtingar‑ham“ (energy‑saving mode), sem gerir forritum kleift að fresta ónauðsynlegum AI‑verkum á viðeigandi hátt. Af hverju uppfærslan skiptir máli er tvíþætt. Að styrkja Stolen Device Protection svarar vaxandi áhyggjum um að þjófar gætu nýtt sér staðbundin AI‑gögn til að draga fram persónulegar upplýsingar, eins og var bent á í nýlegum öryggisskýrslum. Á sama tíma sýnir rafhlöðu‑vittandi LLM‑þröskuldinn Apple’s víðtæka stefnu um að gera AI á tækinu sjálfbært, ályktun sem gæti haft áhrif á neytendaákveðni um AI‑þunga eiginleika á norrænum mörkuðum þar sem orkunýting er mikilvæg. Það sem þarf að fylgjast með næst er iOS 26.5, sem er í orðræðu um að útvíkka LLM‑þröskuldastýringuna yfir í iPadOS og koma með þróunaraðgengilegt fjarnýtingar‑mælaborð fyrir öryggisatburði. Reglugerðarstjórnir í ESB eru einnig líklegar til að skoða nýja fjarlæga óvirkni‑virkni í ljósi Digital Services Act, þannig að útgáfan gæti leitt til frekari stefnumótunar. Fylgið eftir því hversu fljótt notendur taka í notkun nýja „Eyða LLM skyndiminni“ valkostinn, þar sem snögg innleiðing mun gefa vísbendingu um traust á Apple‑vörnum gegn AI á tækinu.
13

TurboQuant á MacBook: byggja eitt‑áskriftarlokalt stafla með Ollama, MLX og sjálfvirkum flutningsmilliþjóni

Dev.to +1 heimildir dev.to
llama
TurboQuant, opinn hugbúnaður sem kom út í þessari viku, gerir forriturum kleift að setja upp fullkomlega starfandi staðbundið AI‑stafla á MacBook með aðeins einni skipun. Verkfærið bindur saman Ollama til að þjónusta módel, Apple‑MLX keyrsluumhverfi til að flýta upp á útreikningum á M‑seríu örgjörvum, og sjálfvirkt stillandi flutningsmilliþjón sem beina beiðnum til viðeigandi módelendapunkts. Eftir að hafa klónað geymsluna og keyrt `./turboquant.sh` fá notendur umhverfi sem er tilbúið til notkunar og getur hýst allt frá Claude‑stíls aðstoðarmönnum til nýja opna kóðans Gemma 4 módel, án þess að þurfa að snerta skýið. Útgáfan er mikilvæg því hún dregur saman sundurlægir uppsetningarferlar sem hafa hamlað tilraunum með staðbundnum módelum. Fyrir fyrr þurftu forritarar að setja upp Ollama, byggja MLX og handvirkt tengja við öfugan milliþjón — skref sem oft kröfðu djúpa kerfisþekkingu og endurtekinna villuleitna. Með því að sjálfvirknivæða þessi atriði lækkar TurboQuant hindrunina fyrir norræna sprotafyrirtæki, rannsóknarstofnanir og áhugamenn sem vilja halda gögnum á eigin neti af persónuverndar- eða seinkunarástæðum. Tímasetningin fellur í takt við bylgju staðbundinna módeláherslna: aðeins nokkrum dögum áður opnaði Google kóðann að Gemma 4, og við sýndum hvernig GitHub Copilot CLI er hægt að para saman við LM Studio á MacBook. TurboQuant pakkar í raun þessi framfarir í lausn sem er tilbúin til notkunar, og lofar fljótari frumgerðarvinnslu og nánari samþættingu við IDE‑forrit sem þegar styðja staðbundna útreikninga. Það sem á eftir að fylgjast með er hversu fljótt samfélagið tekur upp og þróar skriftuna. Fyrstu greinar eru þegar að bæta stuðning við kvörðuð Llama 3 útgáfur og fjöl‑GPU flutning á nýrri MacBook Pro tölvum. Útgáfur af afköstum munu sýna hvort MLX‑hröðuð leið nái að keppa við skýjaflokka afköst, sem er lykilþáttur fyrir framleiðsluverkefni. Ef frammistaðan stendur undir væntingum gæti komið IDE viðbætur — kannski jafnvel Copilot‑stíls viðbót — sem nýta TurboQuant‑milliþjóninn til að bjóða upp á óaðfinnanlegan, ónetaðan kóðaþjónustu. Næstu vikur ættu að skýra hvort þessi eitt‑áskriftarstafla verði de facto staðlað lausn fyrir AI‑þróun á tækjum í Norðurlöndum og víðar.
13

Hvernig á að greina AI‑framleitt efni með flækjustig og sprengikraft

Dev.to +5 heimildir dev.to
perplexity
Nýtt greiningarrammi sem mælir „flækjustig“ og „sprengikraft“ fær í ský
12

gilest.org: Gervigreind og mannleg rödd

Mastodon +6 heimildir mastodon
voice
Færsla á gilest.org hefur kveikt nýjan umræðu um takmörk stórra tungumálalíkana og heldur því fram að nútíma texti sem er framleiddur af gervigreind sé „rusl“ vegna þess að hann skorti raunverulega mannlega rödd. Höfundurinn, þekktur á X sem @gilest, bendir á að flest úttak líti út eins og „daufur, afleiddur og ógreinanlegur frá þúsund öðrum textum“, gagnrýni sem hljómaði víða eftir að færslan var endurþráð af nokkrum umfjöllunum um gervigreindar‑iðferðis. Athuguninni er mikilvæg vegna þess að hún varpar ljósi á spennu sem hefur byggst upp síðan kynning á samtalsþjónustum sem geta framleitt flæðandi texta í stórum mæli. Þó að verkfæri eins og ChatGPT, Claude og Gemini hafi umbre
12

Nýja AI Meta bað um óunnin heilsugögn mín – og gaf mér slæmar ráðleggingar

Mastodon +1 heimildir mastodon
metaprivacy
Meta nýjasta AI spjallforritið vakti umdeild umfjöllun eftir að það bað notanda um óunnin heilsugögn og svaraði með umdeildum læknislegum ráðum. Í tilraun á nýja “Meta AI Health” aðstoðarmanninum beindi kerfið prófunaraðilanum að hlaða upp ítarlegum líffræðilegum skráningum – hjartsláttarferlum, svefnstigum, glúkósamælingum og jafnvel nýlegum blóðprufum – áður en það reyndi að greina viðvarandi hósta. innan nokkurra mínútna lagði spjallforritið til „stoppið sýklalyfin sem þú hefur fengið“ og „aukðu daglega koffínneyslu til að styrkja ónæmiskerfið“, ráðleggingar sem læknar fljótt merktu sem hættulegar. Atvikið, sem Wired skýrir, dregur fram vaxandi spennu milli AI-ambítíunnar og öryggis notenda. Meta hefur staðsett samtalsaðila sína sem næsta landamót persónulegra þjónustu, með því að nýta gnægilegan safn gagna sem safnað er á Facebook, Instagram og Quest-umhverfinu. Með því að biðja um óvinnu heilsumælingar gefur fyrirtækið til kynna að það vilji byggja gagnadrifinn heilsulagslögun sem gæti á endanum knúið markvissa auglýsingu eða dýrar velferðarsíður. En ónákvæmar ráðleggingar spjallforritsins sýna áhættuna við að setja óprófaða læknislega rökstuðning í stórum skala, sérstaklega í ljósi evrópska AI-löggjafarinnar og ströngra GDPR-reglna sem flokka heilsugögn sem háskaða flokk. Af hverju þetta skiptir máli fer langt umfram eitt mistök. Ef Meta heldur áfram með heilsusniðnar eiginleika, mun það ganga í hópinn sem inniheldur Apple HealthKit, Google Med‑PaLM og komandi læknislegu líkanapróf OpenAI. Hver þátttakandi stendur frammi fyrir nákvæmri skoðun á því hvernig AI túlkar persónuleg heilsugögn og hver ber ábyrgð þegar ráðleggingar fara úrskeiðis. Atvikið ýtir einnig á víðtækari umræður um hvort tæknifyrirtæki eigi að fá leyfi til að græða á óunnum heilsugögnum án skýrrar læknisfræðilegrar yfirumsjónar. Hvað á að fylgjast með næst: Meta hefur lofað „hröðum endurskoðun“ á læknislegu einingunni í spjallforritinu og bent á strangari innri öryggisráðstafanir. Stjórnvöld í ESB og Bandaríkjunum eru líkleg til að biðja um nánari upplýsingar um gagnavinnslu og áhættumat. Greiningaraðilar í greininni munu fylgjast með hvort Meta stöðvi útbreiðslu, samstarfi við vottuð heilsugæslustöðvar eða endurmerkir eiginleikann sem eingöngu upplýsingatól. Niðurstaðan gæti sett fordæmi um hvernig neytenda‑AI hefur samskipti við persónuleg heilsugögn í tæknigeiranum.
12

SELFDOUBT: Óvissumæling fyrir rökvísi stórt tungumálalíkön með Hedge‑to‑Verify hlutfallinu

ArXiv +1 heimildir arxiv
reasoning
Liður rannsakenda frá Háskólanum í Kaupmannahöfn og sænska AI‑labanum hefur gefið út nýja arXiv‑forskrift, “SELFDOUBT: Uncertainty Quantification for Reasoning LLMs via the Hedge‑to‑Verify Ratio” (arXiv:2604.06389v1). Greinin takast á við langtímavandamál í notkun stórra tungumálalíkana (LLM) við flókið rökvísi: hvernig á að meta áreiðanlega hversu sjálfsörugg líkanið er í hvert svar án þess að nota dýran úrtakstök eða óáreiðanlegar nálganir. Höfundarnir benda á að núverandi einni‑ferðar nálganir — orðaðir sjálfstrauststig eða lengd rökvísi‑ferils — skila oft ólíku frá raunverulegri réttmæti, á meðan Monte‑Carlo dropout eða hóp‑aðferðir krefjast margra framvörpunar í gegnum líkanið og tvöfalda eða þrefalda útreikningstíma. SELFDOUBT kynning á léttvægum mælikvarða sem ber saman tvö stig í ferli líkanins sjálfs. Fyrst býr líkanið til “hedge” svar, tilraunalaus lausn sem er framleidd með lausnargildi (temperature) sem er umhverfisvæn. Síðan framkvæmir það “verify” umferð, þar sem líkanið er beðið um að yfirfara hedge‑svarið miðað við upprunalega vandamálssetninguna. Hlutfallið milli log‑líkinda hedge‑svarsins og log‑líkinda verify‑umferlisins, Hedge‑to‑Verify Ratio (HVR), þjónar sem vísir á sjálfstraust. Tilraunir á viðurkenndum rökvísi‑prófunum eins og GSM8K, MATH og BIG‑Bench sýna að HVR er langt betri í að spá fyrir um réttmæti en orðað sjálfstraust eða lengd ferils, á sama tíma og það bætir við minna en 10 % í útreikningstíma. Afleiðingarnar eru tvíþættar. Fyrir öryggiskrítísk forrit — til dæmis í læknisfræðilegri flóttaþjónustu, fjármálaráðgjöf eða sjálfvirkum áætlanagerð — gerir vitund um hvenær líkanið er líklegt til að gera mistök kleift að beita varúðarráðstöfunum, mannlegum eftirliti eða markvissum afsökunum. Enn fremur fellur þessi mælikvarði í samræmi við nýlegar rannsóknir á ákveðnum rökvísi‑lögum, eins og SymptomWise-rammanum sem fjallað var um 10. apríl, með því að bjóða upp á kerfisbundinn hátt til að loka þeim lögum aðeins þegar óvissan fer upp. Á næstu tíma er áætlað að höfundarnir gefi út opinn kóða fyrir HVR‑útfærsluna fyrir vinsælar LLM‑API‑viðmót, og frumnotendur eru þegar að prófa hana í prompt‑engineering ferlum hjá norðurlanda fjármálafyrirtækjum. Næstu rannsóknir munu líklega kanna hvernig hlutfallið er hægt að stækka til fjölmynda‑líkananna og samþætta það í verkfæra‑ramma sem krefjast ytri sannprófunar þegar HVR fellur niður fyrir stillanlegum mörkum. Ef samfélagið tekur SELFDOUBT til sín, gæti óvissu‑meðvitað rökvísi orðið að sjálfgefnu öryggiseiginleika í næstu kynslóð AI‑vara.
12

SymptomWise: Ákveðinn rökfræðilag fyrir áreiðanleg og skilvirk AI‑kerfi

ArXiv +6 heimildir arxiv
ai-safetyreasoning
Lið af rannsakendum frá Háskólanum í Kaupmannahöfn og Sænska tölvunarfræðistofnuninni hefur sett nýja pre‑print út, “SymptomWise: A Deterministic Reasoning Layer for Reliable and Efficient AI Systems” (arXiv:2604.06375v1), þar sem lagt er til blandað arkitektúr sem festir reglubundið rökfræðimódule við stór tungumálalíkön sem notuð eru til einkenna‑greiningar. Höfundarnir halda því fram að hreinar end‑to‑end framleiðslupípur—sem eru algengar í núverandi fjarlægri heilbrigðis‑spjallmenni—þekkjist við skynjunarbrot, óskýra ákvörðunarleiðir og stundum árekstra sem geta ógnað öryggi sjúklinga. SymptomWise setur inn ákveðinn lag sem tengir táknmyndir um einkenni, sem eru framleiddar af líkani, við handvirkt útbúinn þekkingar‑graf af klínískum leiðbeiningum, hreinsar út ólíkleg útkomur og framleiðir rekjanlega rökfræðiköllu fyrir hvert tillögu um greiningu. Þessi þróun er mikilvæg vegna þess að hún takast á við þrjá helstu hindrunarþætti sem hafa hamlað víðari innleiðingu AI‑triage‑tækja: áreiðanleika, útskýranleika og reglugerðaruppfyllingu. Með því að tryggja að hver tillaga sé hægt að rekja til tiltekins atriðis í leiðbeiningunni, lofar kerfið endurskoðendum á áþreifanlegan endurskoðunarleið, eitthvað sem stjórnvalda í ESB og Noregi hafa ítrekað krafist. Aðferðin fellur einnig vel að nýlegum umræðum um ákveðna mynsturviðurkenningu í stórum tungumálalíkönum, eins og Claude‑Mythos leka sem fjallað var um 9. apríl, og bendir til víðari stefnu í átt að blandaðum módeli sem sameina tölfræðilega flæði með táknrænni vissu. Það sem á eftir að fylgjast með er hvort SymptomWise þróist úr rannsóknarprótotýpu í framleiðslu‑klasa í viðskiptatækjum. Fyrstu notendur eins og Ada Health og KRY hafa sýnt áhuga á tilraunaprófum, og höfundarnir ætla að framkvæma klínískar prófanir í sænskum heimavörslugörðum síðar á þessu ári. Á sama tíma er væntanlegt að Evrópusambandið um lyfjastofnun (EMA) gefi út leiðbeiningar um AI‑stýrða greiningartól, og hver samræming milli þessara stefna og ákveðinna rökfræðiramma gæti flýtt fyrir markaðsleiðangri. Fylgist með nýjum greinum og mögulegum opnum kóðaútgáfum sem gætu gert tæknina aðgengilega um allan norræna heilbrigðstækni‑ekosysteminn.
12

llm-shadow-persona/shadow-persona.md í main · jsynowiec/llm-shadow-persona

Mastodon +6 heimildir mastodon
agentsclaude
Þróunaraðili hefur sett inn nýja „hugmyndaskrá“ í opna‑kóðaverkefnið llm‑shadow‑persona, sem stækkar gagnrýni‑ramma verkefnisins fyrir mótspyrna í stórum tungumálalíkönum (LLM). Framlagið, sem er sett á GitHub í geymslunni jsynowiec/llm‑shadow‑persona, fylgir mynstri sem Andr​ej Karpathy gerði vinsælt, þar sem hann sýndi hvernig sérstakt „skugga“‑líkan getur gagnrýnt og bætt útkomu aðal‑LLM‑ins. Viðbót höfundar pakkar gagnrýni‑logíkina í íforrit (plug‑in) fyrir Anthropic’s Claude, sem neyðir kerfið til að betrumbæta svör sín ítrekað út frá endurgjöf skugga‑persónunnar. Þessi þróun er mikilvæg vegna þess að hún brýr saman tvær nýlegar öryggisvenjur: mótspyrna í sjálfgagnrýni og íforrits‑útfærslu. Með því að innfelldu gagnrýnihringinn beint í Claude getur kerfið framkvæmt þéttari endurgjöfarlöppu án ytri stjórnun, sem gæti dregið úr skáldun og frávikum í samræmi í rauntímaforritum. Aðferðin bendir einnig á hliðrun í átt að samfélagsdrifnum verkfærum sem bæta við eigandi líkani, í takt við nýlegar samvinnur eins og Mythos‑uppfærslur sem Anthropic lagði í FFmpeg, um þær við fjallað var þann 9. apríl 2026. Þegar fleiri þróunaraðilar prófa „skugga“‑aðila, hverfur mörkin milli opins‑kóðas öryggisrannsókna og viðskipta‑LLM‑útfærslu, og spurningar vakna um ábyrgð, notkunarleyfi og skalanleika slíkra íforrita á milli líkanafjölskyldna. Áframhaldandi þróun: höfundurinn hyggst hefja beta‑prófun með litlum hópi Claude‑notenda, þar sem safnað verður tölulegum gögnum um minnkun villna og notendavænt umhverfi. Viðbrögð Anthropic verða lykilatriði til að sjá hvort fyrirtækið muni styðja öryggis‑íforrit frá þriðju aðila eða halda gagnrýni‑stiginu innanhúss. Samhliða tilraunir frá öðrum líkanaveitendum – sérstaklega þeim sem byggja upp svipaðar mótspyrna‑rammar fyrir GPT‑4‑Turbo eða Gemini – gætu kveikt á víðtækari vistkerfi samhæfðra öryggisviðbóta, sem myndi umbreyta því hvernig þróunaraðilar innleiða samræmingarkontroll í daglegum AI‑vinnuferlum.
12

Af hverju AI‑bylting Sal Khan hefur enn ekki átt sér stað, samkvæmt Sal Khan

Mastodon +1 heimildir mastodon
Sal Khan, stofnandi Khan Academy, sagði Chalkbeat þann 9. apríl að „AI‑byltingin“ sem hann hafði ímyndað sér fyrir kennslustofur hafði enn ekki orðið að veruleika. Þegar hann talaði um Khanmigo – kennsluaðstoðina sem byggir á spjallmenni og var sett í loftið í samstarfi við OpenAI árið 2023 – sagði Khan að hann lítur nú á tæknina sem „hluta af lausninni, ekki endapunktinn og allt.“ Athugasemdin merkir umbylgju frá þeim yfirburða kynningu í fyrra ári, þegar Khan Academy kynnti Khanmigo sem byltingarkenndan tól sem gæti boðið persónulega kennslu til milljóna nemenda ókeypis. Fyrstu tilraunir sýndu lofandi framfarir í lesefnisþekkingu og stærðfræðiflutningi, sem leiddi til bylgju fjárfestinga í AI‑knúnum menntatækni. En innleiðing hefur hristist: skólastjórnir vísa í ófullnægjandi kennaramenntun, áhyggjur af persónuvernd gagna og ójöfn netaðgengi sem gæti aukið stafræna sundurliðun. Af hverju endurskoðun Khan er mikilvæg er tvíþætt. Fyrst er Khan Academy enn í dag álitinn traustasti ókeypis námsvettvangur í heiminum; afstöðu þess hefur áhrif á hvernig opinberir skólar úthluta fjármagninu í AI‑tól. Í öðru lagi er tekjuáætlun fyrirtækisins hógvær – hún byggir á framlögum og takmarkaðri premium‑útgáfu – og það þýðir að hver hægari þróun gæti umbreytt stærri markaði, þar sem keppinautar eins og Duolingo Max og Google Gemini for Education reyna að vinna sömu fjárhagsáætlanir í stofnunum. Áframhaldandi þróun mun sýna hvort Khanmigo geti farið frá sértækri tilraun til aðal kennsluaðstoðar í kennslustofunni. Óhagnaðarfélagið hyggst gefa út kennarastjórnborð um sumrið, sem ætlað er að veita kennurum rauntímaupplýsingar um samskipti nemenda við kerfið og gera þeim kleift að grípa inn þegar módelið gerir mistök. Næstu óháða rannsókn, sem menntaráðuneytið í Bandaríkjunum hefur pantað, mun meta námsárangur í fjölbreyttum skólum og gæti annaðhvort staðfest eða dämpað frekari innleiðingu. Jafnframt verður stefnumótun um vernd persónuupplýsinga nemenda lykilatriði. AI‑lög EU, sem á að taka gildi sein
12

OpenAI drepur Sora og fellur í ringulreið

Mastodon +6 heimildir mastodon
openaisora
OpenAI lokaði skyndilega á Sora, áætlaða texta‑í‑myndgerðarlíkanið sitt, eftir stutta beta sem vakti bæði spenntu og áhyggjur. Fyrirtækið tilkynnti lokunina á þriðjudegi og nefndi “óvænt öryggisáhættu” og vaxandi reglugerðarþrýsting sem helstu ástæður fyrir að draga þjónustuna. innan nokkurra klukkustunda settu eldri verkfræðingar og vörustjórar stuttar skilaboð á innri spjallborð, og fjöldi uppsagnir var skráð, sem bendir til dýpri skipulagslegrar sprungu. Sora var sett fram sem næsta landamót í framleiðslu‑gervigreind, með loforð um að breyta skrifuðum fyrirmælum í fullkomlega gerða myndskeið í nokkrum mínútum. Geta hennar ógnaði að umbreyta efnissköpun, markaðssetningu og skemmtun, og setti OpenAI í beina samkeppni við nýrri myndgerðarrannsóknir Google DeepMind. Sú skyndilega lokun er því merki um stefnumótandi tilbakadrátt á tíma þegar iðnaðurinn er í kapphlaup til að kommersialísera hásveiflukenna framleiðslutól. Hún d
12

Málfræði sem hegðunarfræðilegt biometrísk: notkun á greindarlega hvöttum málfræðimódelum til höfundsstaðfestingar - Humanities and Social Sciences Communications

Mastodon +6 heimildir mastodon
Málfræði sem hegðunarfræðilegt biometrisk: notkun
12

Anthropic greinir þriðju aðila viðskiptavini í gegnum kerfisábendingu, ekki HTTP-hausum

HN +5 heimildir hn
anthropic
Anthropic tilkynnti nýja aðferð til að greina þriðju aðila viðskiptavini sem nálgast Claude‑líkan sín, og færir athyglina frá hefðbundnum athugunum á HTTP‑hausum yfir í greiningu á kerfisábendingunni sem er innbyggð í hverja beiðni. Fyrirtækið opinberaði að tækni, sem var sett í umferð í þessari viku á API‑kerfinu, greinir fyrstu kerfisleiðbeininguna til að finna undirskriftir eða mynstur sem gefa til
12

Sýslumaður í Bandaríkjunum hafnaði beiðni Anthropic um að fjarlægja merki um „áhættu í birgðakeðju“

HN +1 heimildir hn
anthropic
Sýslumaður í miðbæ Washington, D.C., hafnaði beiðni Anthropic um að fjarlægja „áhættu í birgðakeðju“ merkið sem Pentagon hefur sett á Claude-módelin. Merkið, sem er sett samkvæmt áhættustjórnunarramma deildar varnarmála (Department of Defense) um gervigreind, bannar notkun Anthropic-módelanna í öllum bandarískum ríkiskerfum sem teljast viðkvæm fyrir árásum á birgðakeðju. Anthropic hélt því fram að merkið væri ógrundvallað og skaði viðskiptatækifæri fyrirtækisins, en dómari fann að mat deildarinnar var nægjanlega studdur með leyndum ógnargreiningum. Úrskurðurinn byggir á röð lagalegra árekstra milli AI‑fyrirtækisins og bandaríska ríkisstjórnarinnar. Eins og við skýrðum 9. apríl, hafnaði dómstóllinn áður að hindra svartlista Pentagon á Anthropic, og 10. apríl útskýrðum við hvernig illgjarnir milliliðarsárásir gætu ógnað LLM‑birgðakeðjum. Dómurinn dregur fram vaxandi vilja stjórnvalda til að setja öryggismerki sem geta í raun lokað á AI‑tækni, og endurspeglar breiðari áhyggjur um falin bakdyr, skemmdir í þjálfunargögnum og erfiðleika við að yfirfara þriðju aðila í innviðum. Fyrir Anthropic takmarkar merkið aðgengi að arðbærum varnarsamningum og gæti hvatt aðrar stofnanir til að innleiða svipuð takmarkanir, sem gæti umbreytt tekjumódelinu og leitt til meiri gagnsæis í birgðakeðju. AI‑umhverfið í heild sinni fylgist náið með, þar sem fordæmið gæti verið beitt á aðra birgja eins og OpenAI eða Google, og auka þannig reglugerðarþunga á greininni. Næstu skref eru líklegur áfrýjun Anthropic til Federal Circuit, þar sem lagaleg rök um réttindi og sönnunargögn merksins verða prófuð. Lögframleiðendur eru þegar að vinna að eftirlitslögum sem gætu kóðað yfirvald til að merkja, og Pentagon áætlar að gefa út uppfært leiðbeiningar um áhættumat AI seinna í sumar. Hagsmunaaðilar ættu að fylgjast með niðurstöðu áfrýjunar, öllum þingfundum og næstu stefnumótunarmemo deildar varnarmála til að fá vísbendingar um hvernig birgðakeðjuöryggi mun móta innleiðingu AI í opinberum geira.

Allar dagsetningar