AI News

503

Djúpsköpunarfélagið DeepSeek opnar högg að fjárfestum

Mastodon +7 heimildir mastodon
deepseekfundingstartup
DeepSeek, það Shanghái-búsett AI-félag sem er þekkt fyrir stóra tungumálamódel sitt sem keppir við ChatGPT frá OpenAI, er að undirbúa opnun höfuðstóls síns fyrir ytri fjárfestum, samkvæmt upplýsingum sem Yicai Global hefur fengið. Þessi ákvörðun er ekki talin vera einungis fjárfesting heldur fremur ákvörðun sem er ætluð til að tryggja starfsfólk og rannsóknarmenn sem hafa verið fjarlægðir af keppinautum í algjörum AI-talent-stríði á heimsvísu. DeepSeek var stofnað árið 2022 af fyrrum starfsmönnum Baidu og iFlytek og hefur þegar tryggt um 200 milljónir dollara í frum- og A- fjárfestingar, sem hefur leyft fyrirtækinu að kynna sitt fyrirsjáanlega módel, DeepSeek-Chat, og safn fyrirtækja-API. En hægti módelskali, ásamt hávaxandi launakröfum, hefur sett fyrirtækið í hættu á mannauðardreifingu. Með því að bjóða nýjum eignarhafa - sem gætu verið fjárfestingarfélag, ríkidætur auðlindafjárfestingar eða jafnvel áætluðir viðskiptafélagar - vonast DeepSeek til að búa til safn hlutabréfa sem geta verið notaðir til að veita hlutabréfaval og viðhaldsbonús, sem jafna starfsmannahagsmuni við langtímagildi fyrirtækisins. Þessi málsdáttur fer úteftir einn startup. Kínverski AI-sektorn er undir þrýstingi til að halda samstarfi við bandamenn í Bandaríkjunum og Evrópu, á meðan hann klýfur þröngri fjármagnsstjórnun og eftirlit. Ef DeepSeek tekst að breyta nýjum fjármagni í sterk viðhaldsramma, gæti það sett sýnilegt fyrirmynd fyrir aðra kínverska AI-félag sem eru að berjast fyrir að varðveita mannauð sinn án þess að byggja einungis á ríkidætur styrki. Fjárfestar og iðnaðarvaktar munu nú fylgjast með stærð og samsetningu næstu fjárfestingar, virði DeepSeek og meðferð við aðrar áætluðar samvinnu. Jafn mikilvæg mun vera að fylgjast með næstu vörumörkum fyrirtækisins - sérstaklega útgáfu margmiðlunar- og útvíkkun á skýjaþjónustu - sem mun prófa hvort nýtt fjármagn þýðir raunverulegan keppnisförða í keppni um næstu kynslóð AI.
424

Ríkisveitingin notar Anthropic sýnir þrátt fyrir svartaskrá

Ríkisveitingin notar Anthropic sýnir þrátt fyrir svartaskrá
HN +7 heimildir hn
anthropic
Ríkisveitingin hefur hafnað að nota Mythos-forboðið frá Anthropic, þrátt fyrir að Vararnir (Department of Defense) hafi formlega merkt tæknið sem áhættu fyrir birgðalínu og sett það á svartaskrá sína fyrra mánuði. Samkvæmt fjölmörgum fréttum notar Ríkisveitingin aðallega AI-tæknin til að skanna eigin net fyrir sérhæðar og áreiðanleika, notkun sem líkist þeirri sem aðrir aðilar nota módelið fyrir innri öryggisathugun. Anthropic kynnti Mythos sem sérhæfða öryggisvörð, með því að lofa að geta greint kóða, staðfest misþýðingu og mælt með leiðbeiningum um leiðir til að leiðrétta villur á hraða sem er langt umfram mannaþorð. Merkingin frá Vararnirnar kemur þó af því að þeir eru áhyttir um að þjálfunargögnin og undirliggjandi byggingin gæti verið sárbær fyrir óvinveitta aðila, áhætta sem er veruleg vegna áhættu á þriðja aðila skýjþjónustu. Með því að fara framhjá svartaskránni sýnir Ríkisveitingin að hún sé villig að priorita operational áhættu yfir þeim nýju öryggisvörðum sem Vararnirnar eru að reyna að framfylgja. Ákvörðunin er mikilvæg af fjölmörgum ástæðum. Fyrst, hún undirbýr vaxandi spennu milli hröðrar AI-notkun í undirröðum og nýju reglugerðarrámanni sem á að koma í veg fyrir mögulegar bakdyrar. Annar, hún vekur spurningar um millidepartments-samvinnu: ef Ríkisveitingin getur farið framhjá tilskipun Vararnirnar, gætu aðrir deildir fylgt þeim, sem myndi leysa undir áhrif svartaskrárinnar. Loks, ákvörðunin bætir vigt á fyrra viðvörunum frá fjármálaráðherrum og höfuðbankamönnum, sem hafa flaggað Mythos sem kerfisáhættu, og frá öryggisfræðingum eins og Bruce Schneier, sem viðvarar við að ótakmörkuð AI-verkfæri gætu orðið ný árásarflöt. Bíða eftir formlegri svari frá Embætti varnarmálaráðherra, sem gæti þvingað framfylgju eða gefið út nýar leiðbeiningar um AI-kaup. Þingnefndir eru líklegar til að kalla báðar Ríkisveitingina og Anthropic til vitnisburðar, og allar lagalegar áskoranir gegn svartaskránni gætu sett fordæmi fyrir það hvernig AI-módel eru stjórnað á ríkislandsvæði. Atburðurinn setur einnig þrýsting á Anthropic að leysa úr deilum sínum og skýra uppruna Mythos-sjálfvirkni, þátt sem gæti ákvarðað hvort módelið sé áfram umdeilt eign eða sé loks dregið úr ríkisnotkun.
365

Upphaf menningar – Suno og Deepseek birta AI‑lag

Mastodon +7 heimildir mastodon
deepseek
AI‑stýrða tónlistarvélin hjá Suno hefur nýlega kynnt „Upphaf menningar“, algerlega gervihljóðspil sem sönglínan er flutt með UTAU‑stíls raddbanki og textarnir eru skapaðir af stórt tungumálalíkani Deepseek. Lagið, sem er sett á YouTube (https://www.youtube.com/watch?v=_hjsBXt6_N4), er nýjasta samstarf norrænra AI‑fyrirtækja og markar framfarir frá „Compass North“ tilrauninni sem við fjölluðum 14. apríl, þegar Suno og Deepseek fyrst tengdu tónlistarsköpun við AI‑skrifaða ljóð. Útgáfan sýnir hversu langt gerandi hljóð hefur þróast frá skemmtilegu tilraunaverkefni yfir í vinnuferli sem getur framleitt fínt ígrundað, tegundartengt efni eftir beiðni. Líkani Suno, sem er nú í boði í rússnesku tungumálaportalinu, getur samið melódíur, raðað hljóðfærum og framkallað söngspil án mannlegra flytjenda. Textavél Deepseek veitir samhengisviðkvæma ljóð, aðlögun tóna og frásagnar að eftirspurn notandans. Saman framleiða þau lag sem líður eins og meðvitað smíðuð verk, ekki bara handahófskennd blanda, með vocaloid‑líkum tónum sem höfða til sértækra aðdáenda en eru samt aðgengilegir almennum hlustendum. Iðnaðarskoðendur líta á samstarfið sem prófun á viðskiptalegri líkind AI‑einungis tónlistarframleiðslu. Ef skapandi geta framkallað tónlist án höfundaréttargjalds á nokkrum mínútum, gætu efnahagslíkur hljóðspilaleyfisskráningar, sjálfstæðra leikja tónlist og TikTok‑stíls efnis breyst verulega. Á sama tíma vakna spurningar um höfundarrétt, tilvísun og framtíðarhlutverk mannlegra lagahöfunda, sérstaklega þegar vettvangar eins og Suno víkka út á óenskt markaði. Áframhaldandi þróun: Suno hefur bent á áskriftarstig sem mun leyfa notendum að fínstilla raddeiginleika, á meðan Deepseek er að koma í loftið fjöltyngda textamódel. Báðar fyrirtækin eru að vinna að innleið
346

Anthropic kynnti Claude Design, nýtt AI‑verkfæri sem gerir notendum kleift að búa til myndir eins og frumgerðir

Anthropic kynnti Claude Design, nýtt AI‑verkfæri sem gerir notendum kleift að búa til myndir eins og frumgerðir
Mastodon +7 heimildir mastodon
agentsanthropicclaude
Anthropic kynnti Claude Design á þriðjudaginn, nýtt tilboð frá Claude Labs sem breytir einföldum textaáherslum í fíngerða myndræna eignir eins og vörufrumgerðir, skyggnusýningar og markaðsefni. Notendur slá inn lýsingu—„slétt uppkast af lóðfleti fyrir fjármálaforrit“ eða „þriggja dálka skyggna sem dregur saman niðurstöður Q2“—og kerfið skilar myndum sem er hægt að flytja út, uppsetningartillögum og breytanlegum vigurskrám. Þessi eiginleiki byggir á nýlegum uppfærslum á verkfæranotkun Claude, sem við fjölluðum um 20. apríl þegar sprotafyrirtækið tilkynnti að líkanið gæti stjórnað hugbúnaði á tölvu eins og manneskja. Útgáfan táknar ákvörðunarfullt skref fyrir Anthropic frá textamiðaðri spjallmenni í átt að full
303

Óvart móti Anthropic: Claude Desktop kemur með njósnabörgum

Óvart móti Anthropic: Claude Desktop kemur með njósnabörgum
Mastodon +8 heimildir mastodon
anthropicclaudeprivacy
Anthropic sýnir Claude Desktop-client með falinn drop-per sem setur njósnabörgum á vinnuvélar með Windows. Öryggisfræðingar sem rannsökuðu uppsetningarforritið uppgötvuðu að eftir að Claude-forritið hefur verið sett upp í C:\Program Files (x86)\Anthropic\Claude, vísar skjáskammstökkunin til VBScript (Claude.vbs) sem er geymd í tímabundnu SquirrelTemp-möppu. Þegar skjáskammstökkunin er smellt, opnast raunverulega AI-svigarflotan á meðan skriptið keyrir ósjýnilegt annað stig af nykur sem opnar bakdyr til vélarinnar, sem gefur fjarnágang að skrám og kerfisupplýsingum. Ógnarþátturinn er falinn í MSI-pakka sem líkir eftir opinberi uppsetningarröð Anthropic, sem gerir hann ógreinanlegan frá raunverulegu niðurhalinu fyrir flesta notendur. Drop-perinn virkjar aðeins þegar skjáskammstökkunin er notuð, sem þýðir að njósnabörgum geta verið dóttir í daga eða vikur áður en nein netþjónusta er athuguð. Fræðingar segja að kóðinn búi yfir einkennum þekktarra viðskipta-eyðingu-verkfæra, sem bendir til ákveðins áformar en ekki tilviljandi pakkingar. Upplýsingarnar hafa áhrif þar sem Claude Desktop er markaðssett sem vinnuvæðingar-„fyrst“ AI-aðstoðar, sem lofar gerðarlausu samþættingu við tölvupóst, dagatal og skráarkerfi. Með því að setja í felu bakdyr, ógnar Anthropic sjálfir öryggisvætti sem það lofar, og setur fyrirtækja- og einkaskrár í hættu á misnotkun. Atburðurinn bætir einnig við röð síðustu öryggisáhyggjur um Anthropic, þar á meðal NSA-leynilegu notkun á Mythos-módelinu þrátt fyrir svartaskrá og endurþróun Claude-kóðabasissins sem afhjúpaði víðtækar starfshætti. Það sem á að horfa á næst: Anthropic hefur ekki gefið út formlega yfirlýsingu, en iðnaðarfræðingar vænta að neyðapössun og þægilega athugun á dreifingarleiðum skrifborðs. Reglufyrirkomar í ES og Noregi gætu opnað rannsóknir undir GDPR og AI-lögum sem eru á komustigi. Notendur eru ráðnir til að afhenta Claude Desktop strax, staðfesta heildarleika skráa sem eru eftir og fylgjast með netþjónustu fyrir grunsamlegar útgangandi tengingar. Atburðurinn er líklegur til að hraða krefjum um strangari öryggisstaðla fyrir AI-þróun.
226

Hvernig á að stjórna notkun Claude Code í verkfræðiteymi

Hvernig á að stjórna notkun Claude Code í verkfræðiteymi
Dev.to +7 heimildir dev.to
anthropicclaude
Anthropic hefur tekið í notkun sérstakan stjórnunarlag fyrir Claude Code, AI-aðstoðarverkfæri fyrir forritun sem hefur breiðst hratt út á verkfræðiliði. Nýja "Claude Code Enterprise" vélvitarinn leyfir kerfisstjórum að setja hlutverka-bundnar leyfir, afla efni síur og fylgjast með notkun í gegnum rauntíma yfirlitsskjá og skoðunarskrá. Anthropic kynnti eiginleikann eftir að viðskiptavinur afhjúpaði áfall: yngri forritari notaði Claude Code til að búa til bókasafn sem óvart komst að notkun úrelts innanviðis API, sem vildi afhjúpa mögulegan öryggisvillu áður en hún komst í framleiðslu. Atburðurinn birti hvernig djúpa þekkingu módelins á kerfum, sem er auðveldandi vinnu, getur einnig sleppið undan hefðbundnum vinnslumáta-öryggisvörnir ef ekki er komið í veg fyrir. Þetta málið er mikilvægt þar sem Claude Code er ekki lengur takmörkuð verkfæri fyrir hálfan hóp eldri verkfræðinga; eigin rannsóknir Anthropic sýna að 132 starfsmanna fyrirtækisins eru núna að nota módelið daglega, og ytri könnunarnir benda til svipaðra notkunarkurva í stórum fyrirtækjum. Þar sem aðstoðarverkfærið getur sameinað byggingarmyndir, skrifað frammistöðukröfur og jafnvel mælt með þriðja aðila ákveðnum, veldur ótakmörkuð notkun áhyggjum um gæði kóða, lekaupplýsinga um eignarrétt og reglugerðarsamræmi - einkum á sviðum með strangar reglur um meðferð gögn. Með því að veita sýn í "hver búðu til hvað, hvenær og undir hvaða stefnu" hyggur Anthropic á að staðfesta AI-drifna þróun með núverandi stjórnunarrammum. Það sem má líta á er hvernig hratt vélvitarinn fær að fá fótfestu meðal norðurlandanna sem hafa þegar reynt Claude Code í prójektum, eins og fram kom í fyrra fréttum okkar um staðbundnar yfirlitsskjá og einkamálaréttarstjórn. Samvinnu við CI/CD-pípur, sjálfvirkar stefnuákvörðun á meðan pull-requests athugasemdir og útgáfa notkunarmálsbana eru áætluð fyrir næsta kvartál. Keppinautar eins og GitHub Copilot og Google Gemini eru væntanlega að svara með samanburðarlegum stjórnunarhópum, sem mun gera AI-kóða-stjórnun að nýjum baráttuvellustöðum fyrir fyrirtækiþróun.
226

AI Leaks and News (@AILeaksAndNews) á X

Mastodon +8 heimildir mastodon
appledeepseekgoogle
DeepSeek, kínverskt gervigreindar‑startup, tilkynnti 300 milljónir dollara fjármögnunarrunda sem hækka verðmæti fyrirtækisins í 10 milljarða dollara. Fjármagnið, sem kemur frá blöndu af innlendum frumfjárfestingarfyrirtækjum og ríkisfjárfestum, er ætlað til að stækka reikniritilbúnaðinn sem þarf til að koma á fót DeepSeek‑v4, næstu kynslóð stórtungumálalíkansins hjá fyrirtækinu. Þessi fjármögnun er stærsta einnota innstreymi í kínverskan LLM‑þróunaraðila í ár og sýnir að AI‑geirinn í landinu er enn í lagi að draga að sér djúpar vasa þrátt fyrir þrengdar útflutningsstýringar á háþróuðum örgjörvum. Fyrri líkön DeepSeek, eins og opinn kóða DeepSeek‑Coder, hafa fengið lof fyrir kóðunarfærni sína og hafa náð að ná til þróunaraðila í Austur-Asíu. Með því að stækka í v4 vonast fyrirtækið til að minnka frammistöðu- og tæknimuninn á milli sín og vestrænra keppinauta eins og OpenAI, Anthropic og Google, þar sem síðustu fjármögnunarrundir þeirra hafa nýlega flýtt upp – Anthropic, til dæmis, tryggði landsvísanlega útgáfu af Mythos‑líkaninu sinn nokkrum dögum áður en leki í frumkóða kom fram. Fjárfestar líta á þessa umferð sem veðmál á getu Kína til að byggja innlenda reikniritklasa, sem er stefnumarkandi forgangsverkefni eftir að Bandaríkin takmarkuðu sölu hálfleiðara til kínverskra AI‑fyrirtækja. Innstreymið undirstrikar einnig breiðari þróun: AI‑startup fyrirtæki utan hefðbundins Silicon Valley eru nú að stefna að milljörðu dollara verðmæti, sem umbreytir alþjóðlegu landslagi í mannauði og fjármagn. Það sem á eftir að fylgjast með er hvort DeepSeek nái að koma v4 á áætlun og hvernig frammistaða þess stendur í samanburði við nýjustu útgáfur OpenAI‑GPT‑5.4 og Google‑Gemini. Jafnframt verður mikilvægt að fylgjast með reglugerðum í bæði Peking og Washington, sérstaklega nýjum útflutningsstýringum sem gætu haft áhrif á aðgengi DeepSeek að nýjustu GPU‑tækjum. Næstu fjármögnunartilkynningar frá öðrum asískum AI‑spilurum munu skýra hvort þessi uppblæstur er varanlegur jafnvægisbreyting í AI‑valdi eða stuttvarandi fjármagnsáfangi.
171

Breytingar í kerfisvísunum milli Claude Opus 4.6 og 4.7

Mastodon +8 heimildir mastodon
anthropicclaude
Anthropic setti Claude Opus 4.7 í gang á 16. apríl 2026, og í fyrsta sinn síðan júlí 2024 gaf fyrirtækið út fulla kerfisvísunina sem stjórnar hegðun módelins. Nýlega gefin út vísun er mjög frábrugðin sú sem notuð var í Opus 4.6, og hún styrr þéttingu fyrirskipa, skiptir um endurskoðaða tokenizer og endurmyndar hvernig módelið meðhöndlar tæki, langvinnar vinnuflæði og "agentic" forritunaraðgerðir. Breytingarnar hafa áhrif því kerfisvísan er hin fellda reglubók sem ákvarðar hvernig Claude túlkar beiðnir notenda, prioritarar öryggi og úthlutar reiknigetu. Með því að gera vísuna aðgengilega fyrir almenning, býður Anthropic hönnuðum sjaldgæfa sýn á stjórnvöxlarnir sem stjórna árangri módelins, og er það gegn því sem aðrir stórir rannsóknarstofnar hafa gert. Strangari fyrirskipa safnið dregur úr "hallucination" á flóknu forritunarmálum, og styrkir Anthropic eigin mælikvarða sem sýna að Opus 4.7 nái betri árangri en 4.6 á þeim erfiðustu forritunarköllum. Nýi tokenizer breytir einnig token reikningi, það þýðir að núverandi API-köll geta séð breytingar á kostnaði og token takmörkum. Fyrir utan vísuna, bætir Opus 4.7 við hágæða myndameðhöndlun upp að 3,75 MP og kynningar "xhigh" árangursstig sem úthlutar auka reiknigetu fyrir kröfuhæfar verkefni. Þessar uppgrúnar víkka út að veldi Claude fyrir vinnuflæði sem byggja á myndum og fyrir fyrirtæki sem þurfa dýpri rökfærsla án þess að fjölgja hraða. Það sem má bíða eftir er hvernig samfélagið svarar við vísuninni sem hefur verið gefin út. Fyrra notendur munu líklega reyna að nota vísunargerðahack, en keppinautar geta gefið eftir að fylgja leiðbeiningum Anthropic um opinnleika. Greinendur munu einnig fylgjast með því hvort nýi tokenizer breytir verðlagi og hvort strangara fyrirskipa safnið hafi áhrif á módelið í skapandi sviðum. Næsta módel uppfærsla, sem á að koma síðar á þessu ári, mun sýna hvort Anthropic geti haldið áfram árangri þótt vísan sé opinn fyrir umræðu.
162

OpenAI uppfærir “Codex Desktop” – Aukið framleiðni fyrir ekki‑forritara – ZDNET Japan

Mastodon +9 heimildir mastodon
agentsopenai
OpenAI hefur sett í loftið verulega uppfærslu á Codex Desktop vettvanginn, sem breytir verkfærinu frá kóðara‑miðaðri aðstoð til breiðari framleiðniuppsetningar sem miðar að óteknískum fagfólki. Uppfærslan, fyrst lýst af ZDNET Japan, bætir við tölvu‑stýringarmöguleikum, vafra í forritinu, myndgerð, varanlegri sjálfvirkni minni og markaðsstöð með fleiri en 90 viðbótum. Nýir vinnuflæðis eiginleikar gera notendum kleift að svara athugasemdum í GitHub umsögn, keyra mörg flugstöðvar í skipanalínunni og tengjast fjarlægum þróunarbúðum í gegnum SSH, á meðan Codex forritið fyrir macOS styður nú samtímasamstillta umboðsmanna keyrslu og langtímaverkefna samvinnu. Þessi þróun er mikilvæg því hún gefur til kynna metnað OpenAI til að breyta
150

Hætta að deila AWS-aðgangslyklum með AI-aðila: Betri leið til að tryggja aðgang

Hætta að deila AWS-aðgangslyklum með AI-aðila: Betri leið til að tryggja aðgang
Dev.to +6 heimildir dev.to
agents
Ný öryggisbók er að hvatja þróunarfræðinga til að hætta að deila óbeinum AWS-aðgangslyklum með AI-aðila og í staðinn láta aðila búa til infrastrúktúr sem kóðar sem er beitt af einkvæmum pipelínu. Aðferðin, sem er lýst af skýjar arkitekt Sarvar í nýrri bloggpósti, hefur þegar verið prófuð í fjölmörgum fjármálastofnunum sem notuðu stórar tungumálamódel (LLM) aðila til að útbúa RDS-innstansir, IAM-stefnur og SNS/SQS-birgðir á fljúgum. Í stað þess að fella inn aðgangslykla í keyrslutíma aðilans, gefa aðilar út Terraform-einingar sem lýsa áætluðum auðlindum; aðskildur CI/CD-vinnsla staðfestir kóðann, keyrir stefnuathugun og beitir honum með þjónustuálykla sem hefur takmörkuðar heimildir. Breytingin er mikilvæg þar sem látsá á aðgangslyklum hefur orðið áhættuhegðun í aukningu "agentic AI"-útgáfa. Nýlegar atburðir - eins og Anthropic's skyndilega aftökur á Claude-aðgang fyrir 60-reiknings viðskiptavin - hækkar á því hversu hratt traust getur eyðst þegar aðili getur starfað ótakmarkaður í skýjaumhverfi. Með því að aðskilja áform (áætlun aðilans) frá framkvæmd (einkvæmri beitingarþrep), geta stofnanir sett í framkvæmd samræmi, athugað breytingar og hindra aðalhreyfingar sem annars væru mögulegar með stolið lykil. Aðferðin fellur einnig í lag með AWS-eigin Öryggisþjónustu og DevOps-þjónustu, sem hafa það að markmiði að innbyggja AI í fyrirtækjaöryggisstöku án þess að aukast árásaryfirborði. Það sem á að horfa á næst er hvort aðferðin verður almenn staðal fyrir AI-knúin skýjaútbúningu. Fyrra notendur eru að sameina vinnuflæðið með A2A-aðilaskrá, miðstöðvað skrá sem geymir "Aðilakort" sem lýsa getu og tengistöðum, sem gæti orðið bakgrunnur fyrir yfirliðsgæslu. Iðnaðarfræðingar munu fylgjast með AWS-ferðatíma fyrir þéttara aðgangslykla-lausa samþættingar með Bedrock og öðrum LLM-veitum, auk allra nýrra opinnar kóðabúnaðarverkfæra sem sjálfvirkar Terraform-kóða-lúppuna. Ef módelið sýnist stækkandi, gæti það breytt því hvernig fyrirtæki jafna ágilité á sjálfbærir aðilar með kröftugleika skýjaöryggis.
150

Lærðu að meta gæði AI‑umhverfisins þíns, RAG og LLM

Lærðu að meta gæði AI‑umhverfisins þíns, RAG og LLM
Dev.to +5 heimildir dev.to
agentsrag
Kennsluefni og tilheyrandi bloggfærsla sem gefin var út 19. apríl 2025 af brasilíska AI‑verkfræðingnum Airton Lira Jr. býður upp á fyrstu end‑to‑end handbókina til að mæla frammistöðu sjálfstæðra AI‑umbóta, Retrieval‑Augmented Generation (RAG) pípur og undirliggjandi stórra tungumálalíkana (LLM). Leiðbeiningarnar, með titlinum „Aprenda avaliar a qualidade do seu agente de AI, RAG e LLM“, innihalda skref‑fyrir‑skref glósunótbók sem byggir RAG‑forrit með Mosaic AI Agent Framework, keyrir nýja „Agent Evaluation“ safnið og umbreytir hráum stigum í framkvæmanlegar innsýn. Tímasetningin er mikilvæg. Á síðasta ári hafa norrænir þróunaraðilar keppist um að koma á fót staðbundnum umbúðum – Lore 0.2.0, SQLite‑studd “localmind” CLI og önnur eval‑drifin verkfæri – en eitt sameiginlegt mælikvarða á gæði hefur enn ekki komið fram. Verk Lira safnar saman þeim mælikvörðum sem IBM og nýlegar fræðilegar kannanir leggja áherslu á: hlutfall vel heppnaðra verkefna, tíðni rangfærslna (hallucination), tafartími, skilvirkni í táknum og kostnaður á greiningu. Með því að sjálfvirkni þessara prófa í endurteknum glósunótbók minnkar handbókin hindrunina fyrir stöðuga matun, aðferð sem við fjölluðum um í skýrslu okkar 19. apríl 2026 um örugga útgáfu Lore 0.2.0. Verkfræðingar geta nú innbyggt matunarpípu í CI/CD, gripið um skekkjur áður en þær eru settar í framleiðslu og framleitt skýrsla sem er tilbúin til endurskoðunar og samræmist nýjum kröfum AI‑lögs EU. Stærri AI‑samfélagið vísar nú þegar til kennsluefnisins sem viðmiðunarstað til að búa til viðmiðun, og Mosaic hefur tilkynnt væntanlega samþættingu við Implicator LLM Meter, þar sem nýlega Gemini fór yfir ChatGPT á þeim skala. Hvað á að fylgjast með næst: innleiðing Lira‑rammasins í opinn‑kóða verkefni eins og localmind, útbreiðsla staðlaðra umbúðarviðmiðunaraðila frá evrópskum samvinnuverkefnum og möguleg uppfærslur frá IBM um fyrirtækjaframkvæmd matunartól. Ef handbókin fær fjöðrun, gæti hún orðið de‑facto grunnstoð fyrir trausta umbúðarþróun í norræna AI‑vistkerfinu.
132

Bannað af Anthropic?

Bannað af Anthropic?
HN +5 heimildir hn
agentsanthropicclaudeopen-source
Anthropic hefur skyndilega lokað aðgangi að Claude‑módelum sínum fyrir notendur OpenClaw, opins‑kóða AI‑umhverfisins sem hefur orðið ómissandi í þróun sjálfstæðra tóla. Á þriðjudögum gerði fyrirtækið OAuth‑teikninn óvirkan, sem mörg verkefni treystu á til að auðkenna Claude‑áskriftir, og gerði þjónustuna ónothæfa „án viðvörunar, án umskiptatíma.“ Aðgerðina vakti mikla umfjöllun á Hacker News, þar sem þræðinn safnaði yfir 700 stigum og næstum 600 athugasemdum innan tólf tíma, með forritara sem ásaka Anthropic um „óvirðingu“ og vísa í svipaða lokun Windsurf‑verkefnisins í júní. Bannið er mikilvægt vegna þess að vinsældir OpenClaw hafa gert það að de facto staðli fyrir byggingu fjölskrefa AI‑umbóta í skýi, á jaðri og á skjáborðum. Með því að slökkva á tengingunni truflar Anthropic ekki bara þúsundir virkra pípur heldur gefur einnig til kynna hliðrun í átt að strangari stjórn á viðskiptalegum API‑um sínum. Ákvörðunin kemur í kjölfar víðtækari takmarkana á tækni Anthropic: bandaríska ríkisstjórnin bannaði fyrirtækið að nota í alþjóðlegum verkefnum í febrúar, og svartalista White House hefur neydd stjórnvöld til að semja um takmarkaðan, flokkaðan aðgang að Mythos‑módelinu frá Anthropic. Saman sýna þessar aðgerðir vaxandi spennu milli opins AI‑innovations og fyrirtækja‑ eða stjórnmálastýringar. Hvað á að fylgjast með næst: Anthropic hefur ekki gefið út nákvæma rökstuðning, en beiðni um handvirka yfirferð og sanngjarna áfrýjun er þegar að safna undirskriftum, krefjandi gagnsæjar enduruppsetningar. Forritarar eru að reyna að flytja yfir í aðra módel eins og GPT‑4o frá OpenAI eða Command frá Cohere, á meðan samfélagið ræðir hvort OpenClaw‑vistkerfið geti lifað af fjölda brottför. Atvikið fellur einnig í línu við fyrri umfjöllun okkar um samfélagsdrifna bann á AI‑efni—ákvörðun r/programming þann 5
131

NSA notar Mythos frá Anthropic þrátt fyrir svarta lista

HN +6 heimildir hn
anthropic
Öryggisstofnun Bandaríkjanna (NSA) hefur hafið notkun á óútgefna “Mythos Preview” módelinu frá Anthropic til öryggis- og upplýsingavinnslu, þrátt fyrir að Pentagon hafi formlega merkt San‑Francisco fyrirtækið sem „áhættu í framboðarkeðju“ og að framkvæmdarákvarðan frá febrúar bannaði alþjóðlegum stofnunum að nota verkfæri Anthropic. Tvö eldri heimildir sögðu Axios að netöryggisteymi NSA noti Mythos til að greina ógnaupplýsingar, sjálfvirkt meta veikleika og útbúa skýrslur um viðbragð við öryggisatvikum, þrátt fyrir svörtu listann sem átti að halda tækninni utan stjórnvalda. Aðgerðin er mikilvæg vegna þess að hún setur tvö öflug íhluti bandaríska öryggiskerfisins í árekstur. Áhættumerking Dómsins var ætlað að verja dulkóðuð net gegn hugsanlegum bakdyrum eða gagnaúttektarleiðum sem gætu verið innbyggðar í þriðju aðila AI módelum. Með því að umhverfa þessa takmörkun segir NSA í raun að hagnýtingarlegir ávinningar Mythos vegi þyngra en áætlaðar áhættur í framboðarkeðjunni. Ákvörðunin vekur einnig spurningar um samræmi við framkvæmdarákvarðan frá 27. febrúar, sem gæti leitt til innri endurskoðana eða eftirlits frá löggjafarþingi. Eins og við skýrðum 19. apríl, höfðu fjármálaráðherrar og helstu bankastjórar þegar lýst alvarlegum áhyggjum af áreiðanleika módelins og rangfærslu um útgáfuna. Notkun NSA bætir nýjum lögun í þessa umræður og sýnir hversu fljótt hættuleg AI getur slúið inn í lykilinnviði þrátt fyrir formlegar bann. Væntanleg er formleg rannsókn frá skrifstofu stjórnanda þjóðarupplýsinga, möguleg endurskoðun á áhættumerkingakerfi Pentagon og lagaleg viðbrögð Anthropic við notkun óútgefinna vörunnar. Jafnframt verður mikilvægt að sjá hvort aðrar upplýsingastofnanir eða lögreglu- og öryggisstofnanir fylgi fordæmi NSA, sem gæti umbreytt jafnvægi milli AI nýsköpunar og öryggisvarúðarramma.
130

Claude token teljarinn, nú með líkanasamanburðum

Claude token teljarinn, nú með líkanasamanburðum
HN +7 heimildir hn
anthropicclaudegeminigrok
Anthropic hefur uppfært ókeypis Claude token teljarann, og bætt við hlið við hlið samanburðum fyrir þrjú helstu Claude líkön – Opus, Sonnet og Haiku – ásamt fljótlegu yfirliti yfir samkeppnisaðila í LLM, eins og GPT‑5 og Gemini. Vef‑tólinn sýnir nú hversu mörg token tiltekið spurningarefni tekur í hvert líkan, viðeigandi takmörk á samhengi‑glugga og áætlaða API‑kostnað við núverandi verðstig. Breytingin er mikilvæg því token‑fjöldi er helsti drifkraftur bæði tafar og kostnaðar í vinnuferlum með generative AI. Forritarar sem fínstilla spurningar fyrir Claude þurfa oft að giska á hvort beiðni passi innan 100 k token glugga líkanins eða hve mikið 2 000 token svar mun kosta. Með því að birta token‑útreikning sama textans í Opus (mest hæfileikaríkt, 200 k token gluggi), Sonnet (miðlungs, 100 k) og Haiku (létt, 50 k), gerir teljarinn verkfræðingum kleift að velja ódýrustu líkanið sem samt uppfyllir frammistöðuþörfina. Nýja yfirferðin á milli líkana sýnir einnig sérkenni token‑útreikningsins sem gera 1 000 token GPT‑5 spurningu um það bil 1 200 token í Claude, misræmi sem getur komið á óvart hjá teymum sem eru meðvitað um kostnað. Eins og við skýrðum 20. apríl, er vaxandi fjölbreytni Claude – frá því að skrifa Z80 samsettakóða til að leysa minnis‑göllu villur – að auka notkun í sértækum sviðum. Nákvæm token‑útreikningur fjarlægir nú hagnýta hindrun fyrir þessa notkun, sérstaklega fyrir sprotafyrirtæki og rannsóknarhópa sem fylgjast nákvæmlega með API‑útgjöldum línu eftir línu. Áhorfendur horfa fram á veginn að Anthropic muni koma með rauntíma kostnaðaráætlanir og greiningu á hópvinnslu innan sama viðmóts. Áætlað er að token‑teljara‑API-ið verði opnað til samþættingar í IDE‑viðbætur og CI‑pípur, skref sem gæti staðlað kostnaðarstýringu í norrænu AI‑forritaraumhverfi. Næsta uppfærsla gæti einnig víkkað samanburðinn til að innifela nýrri líkön eins og Grok og komandi Claude‑4 útgáfur, og þannig skerpa hlutverk tólsins sem alhliða fjármálastjórnunarspjald fyrir LLM.
118

P0: Hackathon lokun [2024-05-27 Laug] Ég tapaði í Hackathon ⛈, lausnir okkar hafa lágt stig

P0: Hackathon lokun [2024-05-27 Laug] Ég tapaði í Hackathon ⛈, lausnir okkar hafa lágt stig
Mastodon +19 heimildir mastodon
Einn sjálfstæður forritari birti eftir‑dómar um AI‑miðaða hackathon sem haldinn var 27. maí 2024 og viðurkenndi að liðið hans lauk án verðlauna eftir að lausnin fékk “lágt stig”. Tilboðinu byggðist á LangChain‑stýrðu pípu sem fékk stórt tungumálalíkani (LLM) “samhengi‑spurning‑svar” gagnasett, beindi líkaninu að merkja rangar þríhyrninga og vistaði samtalið í tímabundnu spjallminni til að varðveita samhengi milli köllu. Aðferðin var hugmyndafræðilega hljóðgóð, en féll á grundvelli matsreglna keppninnar, sem refsaði falskri jákvæðni og verðlaunaði nákvæmni á falinni prófunarsett. Afleiðingar þessa missir eru tvíþættar. Fyrst sýnir hún bilið milli frumgerðar‑stigs LLM‑verkfæra og framleiðslu‑stigs áreiðanleika. Þó að LangChain og svipuð rammar lækka hindrunina við að byggja samtalsvélmenni, þurfa þróunaraðilar enn að stjórna spurningar‑stefnu, táknmörkum og villusendingum handvirkt. Í öðru lagi varir atburðurinn í ljósi vaxandi eftirspurnar eftir traustum stjórnunartólum sem geta sýnt fram á sjálfstraust líkana, skráð uppruna merkja og einfaldað endurtekna villuleit – eiginleikar sem nýlegir opinn‑kóða verkefni eins og OpenClawdex, UI‑lagið fyrir Claude Code og Codex, stefna að því að bjóða. Eins og við skýrðum þann 19. apríl 2026, lagði “hugræna rammann til að opna upp í umboðsmanna‑vinnuferla” áherslu á þörfina fyrir kerfisbundna villuleitarlúppu; þessi tap í hackathon er áþreifanleg áminning um að þessar lúpur eru enn óþroskaðar í hratt vaxandi keppnum. Það sem á eftir að fylgjast með er útgáfa 2.0 af LangChain, sem lofar innbyggðum matskrókum, og komandi Norðurlanda AI Hackathon í júní, þar sem skipuleggjendur hafa lofað nánari samþættingu við opinn‑kóða stjórnunartól. Áhorfendur munu einnig fylgjast nánar með öllum frekari tilkynningum frá þátttakandanum, sem bendir á að endurskoða pípun með sjálfstraust‑stigakerfi og nákvæmari minni‑stjórnun. Næstu nokkrir mánuðir ættu að sýna hvort samfélagið geti breytt skyndilegri frumgerðaráhuga í lausnir með stöðugum háum stigum.
117

Setti Anthropic inn njósnaprógramsbryggju á tölvuna mína?

Setti Anthropic inn njósnaprógramsbryggju á tölvuna mína?
HN +5 heimildir hn
anthropicclaudeprivacy
Claude Desktop frá Anthropic hefur í leynilegri aðferð sett inn native‑messaging brú á tölvum notenda, aðgerð sem öryggisrannsakendur telja jafngilda óvirkum njósnaprógramshluta. Brúin er bætt við í staðlaða Claude Desktop uppsetninguna og skráir sig í sjö Chromium‑byggðar vafra – þar á meðal Chrome, Edge, Brave og jafnvel vafra sem notandinn hefur ekki sett upp. Skjölun Anthropic sjálfsins segir að hún styðji ekki nokkra af þessum vöfrum, en brúin er samt til staðar. Brúin er óvirk þar til hún er virkjuð með tilheyrandi viðbót, fyrirtækjastefnuuppfærslu, illgjarnri uppfærslu eða með árásargjarnum kóða sem hvetur áreiti. Þegar hún er virkjuð getur hún opnað beina samskiptaleið milli vafrans og staðbundinna keyrsluumhverfis Claude, sem gerir kleift að keyra handahófskenndan kóða með réttindum notandans. Rannsakendur sem skoðuðu uppsetninguna lýsa hlutanum sem „foruppsett njósnaprógramsgeta, hljóðlega sett, óvirk, í bið eftir virkjun.“ Af hverju þetta skiptir máli fer langt út fyrir eitt tiltekinn vöru. Native‑messaging brúir hafa áður verið nýttar í birgðakeðjuárásum til að dreifa fjarlægis‑trojanum, og nýleg Axios npm-síðurögn sýndi hversu fljótt slíkar breytur geta breiðst út. Claude Desktop er markaðssett bæði til einstakra forritara og fyrirtækja, sem þýðir að brúin gæti breiðst út um fyrirtækjanet utan samþykkis, og gæti þannig brotið GDPR og persónuverndarreglur Noregs. Anthropic hefur enn ekki gefið út formlegt yfirlýsingu, en nýleg öryggisupplýsingar fyrirtækisins – eins og Linux‑kjarnaárásir sem fundust af eigin líkani – benda til að það sé meðvitað um víðtækari árásarflöt. Næstu skref sem þarf að fylgjast með eru möguleg neyðaruppfærsla eða fjarlæging brúarinnar, ítarleg skoðun á Claude Desktop uppsetningunni og eftirlit frá ESB‑ og norrænum persónuverndarstofnunum. Greiningaraðilar í iðnaðinum munu einnig fylgjast með hvort aðrir AI‑verkfæravörslugjafar taki upp svipaðar native‑messaging einingar, og hvernig viðbrögð samfélagsins mótar framtíðar staðla fyrir AI‑hugbúnaðar birgðakeðjur.
117

Anthropic AI‑átak Uber stendur frammi fyrir hindrun

Anthropic AI‑átak Uber stendur frammi fyrir hindrun
HN +5 heimildir hn
anthropicclaude
Innri átak Uber til að innleiða AI‑verkfæri Anthropic hefur runnið út af krafti. Tæknistjóri Praveen Neppalli Naga sagði við The Information að farþegafyrirtækið hafi þegar tæmt AI‑útreikningsáætlun sína fyrir 2026 – $3,4 milljarða í R&D – innan fyrsta fjórðungs ársins. Skorturinn stafar af mikilli notkun Anthropic’s Claude Code, generative kóðunarhjálpar, sem teymir hafa tekið í notkun fyrir allt frá leiðréttingarskriptum til svikgreiningar‑pípur. Ofurútgjöldin krefja Uber til að fara aftur í hönnun, þar sem fyrirtækið endurmetur nú hvernig það getur stækkað AI‑knúna eiginleika án þess að fara yfir kostnað. Eins og við skýrðum 19. apríl, var Claude Code frá Anthropic nýlega lekið og sýndi alvar
109

Þessi manneskja er ekki til

Mastodon +7 heimildir mastodon
nvidia
Þróunarteymi á nýlegum norrænum hackathon opinberaði léttvæg skrift sem breytir vinsælu AI‑myndasíðunni thispersondoesnotexist.com í hagnýtt nafnleyfisverkfæri. Með því að sjálfvirkni þriggja skrefa ferli — niðurhal handahófskennds 1024 × 1024 portretts, skurður með ImageMagick, og fjarlæging allra EXIF‑meta gagna með exiftool — sýndu þátttakendurnir hvernig hver getur framkallað ljósmyndarlíkt „fólk“ sem skilur engar slóðir um uppruna. Staðfesting hugmyndarinnar vakti tafarlausan áhuga þar sem hún umhverfir hefðbundna persónuverndaráskoran við að hlaða upp raunverulegu sjálfsmyndarmynd: myndin sem er framleidd inniheldur engar líffræðilegar upplýsingar, staðsetningartag eða kennitölur myndavélar. En teymin lenti í vandræðum þegar þeir prófuðu að hlaða upp á samfélagsmiðla. Nútíma vefsvæðir treysta sífellt meira á canvas‑byggða fingraförun, vafraaðferð sem býr til falda mynd og greinir smávæg
90

Nýtt opinn hugbúnaður fyrir IPv6 með AVX-512 (línúar B+-tré, raunverulegar BGP-mælingar)

Nýtt opinn hugbúnaður fyrir IPv6 með AVX-512 (línúar B+-tré, raunverulegar BGP-mælingar)
HN +5 heimildir hn
benchmarksvector-db
Nýr opinn hugbúnaður, planb-lpm, gefur cache-vænan IPv6 longest-prefix-match (LPM) véla sem nýtur Intel's AVX-512 SIMD-víddauka. Kjarni hönnunarinnar er 9-ary línúar B-plus tré pakkað í 64-baugar cache-línu lagnir neta, með hverjum laufi sem heldur átta lyklum. Leit fer fram sem hrein forgengis leit: á hverjum innri stigi er ein AVX-512 vpcmpuq skipun fylgt af popcnt sem ákveðir barnanetið, og sama aðgerð á laufinu ákveðir samsvörunarprefixið. Höfundar GitHub skjali sýnir að algorímið víkkar út hverja IPv6 forritið í byrjun-endapunkt á efri 64 bitum, raðar 2 × N markmiðum og leysir innbyrði með stack svo að hver grunnhluti þekkir virkan next-hop. Mælingar sem keyrðar eru á raunverulegum BGP-töflum - yfir 800 k IPv6 forrit - skýra leitartíðni yfir 30 Mpps á einum Xeon Scalable vinnuprosessa og halda seinkun undir 30 ns. Borið saman við fyrri CPU-aðeins lausnir og jafnvel GPU-hraðaðar vélar, skerðir AVX-512 útfærslan minni umferð um allt að 40% þakka þess cache-línu-vænu útlagi. Það sem máli skiptir er tvíþætt. Fyrst, er IPv6 umferð aukist þar sem flutningsfyrirtæki eru að leggja niður arfleifðar IPv4 heimilisréttindi, og háhraða rútar verða að halda línu-þröskuld leitum á stærra og stærra leiðslutöflum. Annar, núverandi data-center CPU eru með AVX-512, sem breytir áður nísku skipunarsafni í almennan afkastalever. Hugbúnaðarrúta sem getur nýtt þessar breiðar vélar án þess að þurfa sérstakar ASIC eða GPU, minnkar bilið á milli almennra vinnutölvur og flutningsfyrirtækja. Það sem má líta áfram eru samvinnuáform við DPDK og VPP-kerfi, þar sem innlimun gæti tekið vélinn inn í framleiðsluvænu pakka-verkflæði. Samfélagið er einnig að rannsaka möguleika á að flytja algorímið yfir á ARM SVE-vélar, sem breytti þessum áhrifum til fjölbreyttra skýjumhverfa. Ef frumraunir afkastans halda áfram undir fjölbreyttum vinnslu, gæti planb-lpm orðið að verða de-facto viðmið fyrir IPv6 LPM á almennri vinnutölvu.
84

Sjálfshlýja til umfjöllun: Náði að slá í gegn í vikulegu verkefninu! Smíðaði hauslausan netþjón, setti upp eigið LLM

Sjálfshlýja til umfjöllun: Náði að slá í gegn í vikulegu verkefninu! Smíðaði hauslausan netþjón, setti upp eigið LLM
Mastodon +7 heimildir mastodon
privacy
Áhugamannaverkfræðingur birti vikulega dagbók sem lesist eins og byggingarplani fyrir næstu bylgju DIY‑gervigreindar. Með því að nota þéttan mini‑PC setti handverksmaðurinn saman hauslausan Linux‑netþjón, setti upp opinn stórt tungumálalíkani (LLM) staðbundið og pakkaði öllum stafli í Cloudflare Tunnel svo kerfið sé aðgengilegt frá hvaða tæki sem er án þess að sýna opinber IP‑tölu. Uppsetningin keyrir alveg án nettengingar nema í gegnum gönguna, sem þýðir að ályktun líkanið er í vélbúnaði notandans og gögn yfirgefa aldrei kassan. Tilraunin er mikilvæg því hún sýnir hvernig hindrunin við að keyra öfluga LLM‑a minnkar frá skýjklústrum í stórum mæli í eina lágorkukassa. Með nýlegum útgáfum kvantíseraðra líkana eins og LLaMA‑2‑7B‑Chat og Mistral‑7B getur hárfín GPU eða jafnvel bara CPU‑tæki skilað nothæfum svörum. Með því að para líkanið við hauslausa uppsetningu forðast höfundurinn þörfina á skjá, lyklaborð eða stöðugri SSH‑fundum—aðferð sem speglar hvernig mörg norræn sprotafyrirtæki setja edge‑AI í notkun fyrir persónuverndarviðkvæm forrit, frá læknisfræðilegum flótaskiptingarbótum til staðbundinna tungumálaþjónusta. Öryggi og sjálfbærni eru næstu breytur sem þarf að fylgjast með. Cloudflare Tunnel veitir dulkóðaða aðgang, en breiðari samfélagið er enn að prófa valkosti eins og Tailscale og Zero‑Trust VPN til að ná strangari stjórn. Á sama tíma lofar vélbúnaðarþróun—NVIDIA‑láglags RTX 4070 Ti, Intel Xe‑HPG og ARM‑byggðir AI‑hröðunarbúnaður—hærri gagnagjöf án þess að draga á orkukostnað hefðbundinna netþjóna. Opinn hugbúnaður eins og HeadlessX, sem gerir ógreinanlega vafra‑sjálfvirkni mögulega, gæti fljótlega verið sameinaður við sjálfhýst LLM til að knýja sjálfstæð umhverfisverkefni sem keyra eingöngu á jaðrinum. Ef þróunin
80

Nýir fréttir um vélræna þroska – Apr 20, 2026: Anthropic gefur út Mythos 5, 10-biljóna-fjölda vélræna öryggismódel

Nýir fréttir um vélræna þroska – Apr 20, 2026: Anthropic gefur út Mythos 5, 10-biljóna-fjölda vélræna öryggismódel
Mastodon +6 heimildir mastodon
anthropicclaudeopenai
Anthropic kynnti Mythos 5 þann 20. apríl, 10-biljóna-fjölda vélræna módel sem er sérstaklega hannað fyrir öryggi. Fyrirtækið segir að nýja byggingin geti greint í blinda árásir, merkt neikvæðan kóða og metið áhættur í rauntíma, og gefur „mannlega“ greiningu yfir netfæra skrár, tölvupóststrauma og skýjaþarfa. Anthropic er að kynna módelið fyrst til lokaða hóps 40 samstarfsaðila, þar á meðal nokkur evrópsk bankar og nokkrir bandarískir varnarmálaráðgjafar, áður en almenn markaðssetning verður síðar á árinu. Útgáfan merkir ákveðið aukningu á vélrænu öryggiskeppni sem hefur sést með því að OpenAI og aðrir seljendur hafa skyndilega sent sérstakar módel á markað. Fyrra útgáfa Mythos vakti eftirlit frá reglugerðaræktendur; eins og við rituðum þann 20. apríl, voru reglugerðaræktendur þegar að eftirlita með módelið vegna áhættu í bankageiranum. Með því að stækka til 10 biljóna fjölda, lofar Mythos 5 um hærra greiningarnákvæmni og lægri villuföll, sem getur gefið notendum með mælanlega yfirburði gegn ríkjum og ransomware-gjöldum. Áætlunin undirbýr einnig hröða uppgang Anthropic: fyrirtækið tilkynnti 30 milljarða dollara í tekjum þessa kvarta, og yfirtekur OpenAI, og er að fjölbreyta með vörum eins og Claude Design, sjónræna samvinnutóli. Útgáfan hefur þegar vakið stjórnmálalega spennu. NSA staðfesti að það er að innleiða Mythos 5 í flokkaðar net, ákvörðun sem hefur vakið gagnrýni frá varnarmálaráðuneytinu, sem hefur varað við að reyna á einum seljanda fyrir mikilvæga varnarmála-infrastrúktur. Á meðan hefur Vercel ræst um árás AI-vélrænnar hökkara, sem hefur þegar vakið áhuga á sterkum varnarmála AI. Hvað á að bíða eftir: prófunarpróf sem óháðir öryggislaboratoríur gefa út mun prófa hvort Mythos 5 uppfylli kröfur sínar. Búist við formlegri svari frá varnarmálaráðuneytinu, kannski upphaflegri endurskoðun eða þrýsting á opinn heimildarkóða. OpenAI er líklega að hröða sína eigin varnarmálaþjónustu, og reglugerðaræktendur gætu þrengt eftirlit þegar hæðarmódel verða innbyggð í þjóðaröryggisvinnu. Næstu mánuðir munu sýna hvort áhættan Anthropic breytir vélrænu öryggislandslagi eða vekur nýjan umræðu um stefnumál.
80

Nýr vísindaleiðsögumaður frá Google DeepMind til að leiða þröskuldarmódel fyrir vélvætti

Markets Insider +7 heimildir 2026-04-17 news
deepmindgooglerobotics
Nomagic, sænska fyrirtækið sem hefur verið að stækka vélvættiværi á meðan árin líða á alla Evrópu, tilkynnti í dag að það hefur ráðið Markus Wulfmeier sem fyrsta vísindaleiðsögumann sinn. Wulfmeier kemur frá Google DeepMind, þar sem hann stýrði rannsóknum á eðlislegri gervigreind og lærni með líkama, og mun leiða nýtt eining sem eru að byggja upp þröskuldarmódel sem eru hægt að flytja yfir í fjölbreytt vélvættiverkefni. Þessi ráðning merkir áætlunarbreytingu fyrir Nomagic. Til nú hefur fyrirtækið byggt á sérsniðnum skynjunar- og stjórnslínum sem eru stilltar fyrir ákveðnar val- og setningarscenario. Með því að koma inn sérfræðiþekkingu DeepMind í stórska, fjölfagleg módel, hyggur Nomagic á að búa til eina "heila" sem getur skilið óþríffaða skynjunarflæði, rökfært um hlutadynamík og búið til vélvættiværi fyrir hvaða vöruhúsútlit sem er. Ef þetta árangur, gæti árangurinn skorðað þröskuldarkaup og lækkaðu vélbúnaðarkostnað og gert kleift að aðlaga nýja vörulínur á skömmum tíma - ótrúlegur kostur á markaði þar sem Amazon-stílar af fullnustu miðstöðvum eru að stækka á háum hraða. Iðnaðarathugunum finnst þessi ráðning vera táknræn fyrir víðari vélvættarsektorn, sem hefur barist við að þýða nýlegar framfarir í stórum tungumálamódelum yfir í verulegar eðlislegar getu. $44 milljóna B-umdæmi Nomagic, sem var lokað síðastliðinn mánuð, gaf fyrirtækinu höfuðstól til að eltast við hárriskrannsóknir sem áður tilheyrðu djúptæknilaboratoríum. Ráðningin gefur einnig til kynna aukinn keppni meðal evrópskra aðila til að ná "þröskuldarmódel" nísku áður en bandarískir jötnar sameina eigin vélvættarlæringu-plötur. Hvað á að horfa á næst: Nomagic hefur lofað að gefa út fyrsta módel sitt yfir fjölbreytt verkefni á 4. fjórðungi 2026 og mun líklega birta prófunarniðurstöður á nýju Eðlislegri gervigreindarsvíta. Samstarf við flutningaog stjórnunaraðila mun prófa tæknið í stórum stíl, á meðan umhverfisvæddir fylgjast með öryggisstaðli fyrir gervigreindastýrðu vélbúnaði. Árangur - eða mistök - Wulfmeier liðsins gæti sett hraðan fyrir næstu bylgju af snjallri sjálvvirku stjórnun í birgðakeðjum.
75

Figma á í vandræðum með Claude Design

Figma á í vandræðum með Claude Design
HN +5 heimildir hn
claude
Anthropics Claude Design, plugin-inn sem breytir texta í förgjöf og sem kom fyrst fram á Claude Cowork þann 17. apríl, hefur nú þegar haft áhrif utan síns eigin notendahóps. Með því að leyfa eitt prompt að búa til hönnunarkerfi, skriðglærar vefi, glæru og einarsíður, getur tólfið sent útkomuna beint í Figma með nýjum flytjafalli. Þessi ákvörðun hefur sent bylgju í gegn um markaðinn fyrir samvinnuhönnun, en hefur líka dregið Figma-verðið niður og vakið hróp um að Figma sé í hættu. Sem við rituðum þann 20. apríl, var Claude Design sett fram sem viðbót við hönnunarpöntunum, en ekki sem arftaki. Nýjasta samvinnan sýnir hins vegar uppbyggingu svæði í viðskiptaframkvæmd Figma: mikill hluti af tekjum þeirra kemur frá "nón-hönnunarseðum" - þ.e. liðum sem nota vettvanginn til samvinnu, afhendingar og umsagnar, en ekki til hönnunar sjálfrar. Þegar gervigreind getur búið til póliseraða förgjöf á sekúndum, verða þessir seðir minna háðir Figma-kernitækjum, sem vekur upp ótt um að notendur sem halda þjónustunni fjárhaglega sterkri, ynni sér. Þessi áhrif ná lengra en til hlutabréfaóttar. Hönnuðir sem taka Claude Design til sín, segja að vinnuferlið finnist "líkt því sem þeir vissu ekki að þeir þurftu", með prompt-inn, hönnun-útkomu hringslæðum sem sleppa margar mannskosti. En útkoman þarf enn að vera endurskoðuð, deild og stjórnað - aðgerðir sem Figma hefur enn yfirburði í. Þessi vél sýnir framtíð sem getur verið blönduð, þar sem gervigreindargerðir lendir í Figma til að pólisera og samvinnu, en ekki alger útbrengsla. Það sem á að horfa á næst: Anthropic-ætlun fyrir djúpri Figma-samvinnu, þar á meðal samtíma-samvinnu og component-bibliotek; Figma-svör, hvort sem er með eigin gervigreindaeiginleikum eða verðlagningu til að halda nón-hönnunarseðum; og almenn markaðsþátttaka sem mun sýna hvort Claude Design verði til auknar eða katalýsator fyrir meiri grunnvölluskilningu í hönnun á rafrænum vörum.
65

Smásjálfvirkni getur breytt miðlunum

Smásjálfvirkni getur breytt miðlunum
Mastodon +6 heimildir mastodon
Sænskt starfsemi kynnti sýnishorn sem gæti breytt langvarandi hugmyndaiðræðu um lófaða innihaldsframleiðanda í verulegan vörulíkan. Þessi tæki, sem er um það bil stærðar nútíma farsíma, keyrir staðbundnar fjölfaglegar módel sem geta framleitt texta, myndir og stuttar myndbönd eftir beiðni. Notendur ýta á hnapp, slá inn beiðni eða velja flokk, og vélinni þýðir óskaða miðil á staðnum, allt án þess að þurfa net tengingu. Þessi tilkynning byggir á bylgju af framleiðslutólum sem hafa nýlega farið frá skýþjónustu til sniðs sem eru vænir til brúkunar á jaðrinum. Eins og við rituðum 19. apríl, sýndi Anthropic's Claude Design hvernig gátsegt getur verið að gera AI aðgengilegt fyrir þá sem eru ekki hönnuðir; nú er sú sama hugmynd verið að þræta inn í vélbúnað, með þeim von að hún mun bjóða upp á sköpun án tölvu og fulla gagnavörn. Með því að halda módelinu á tækinu, sleppur sýnishornið bændum kostnaði og öryggisáhyggjum sem hafa hindrað víðari notkun AI-framleiddra miðla í regluðum geirum eins og fjármálum og heilbrigðisvísindum. Greinendur í iðnaðinum segja að tilkynningin sé mikilvæg þar sem hún vísar til breytingar frá "AI sem þjónustu" til "AI sem persónulegu búnaði". Ef tæknið stækkar, gæti það breytt miðlunarferlum, leyft á ferðamarkaðsauðlindir og gefið neytendum óvenjulega skapandi frelsi. Á sama tíma, getur hæfileiki til að framleiða raunverulegar myndbönd í lófaðri formi valdið rauðum fánastrikum um djúptölu og þörfina fyrir traustar staðla á sannprófun. Starfsemin áætlar takmarkaða beta prófun síðar sumarið, með áherslu á skapandi fólk og fyrirtæki sem þarfnast ótengdra framleiðslu. Verið varðar fyrir frekari prófanir á batterílífi, módel samþjöppunaraðferðum og reglugerðarráðstafanir frá AI-lögin í Evrópu sem tækið fer frá sýnishorni til vörulíkans.
63

Nýir gögn sýna muninn á notkun AI-þjónusta á Norðurlöndum

Nýir gögn sýna muninn á notkun AI-þjónusta á Norðurlöndum
HN +6 heimildir hn
claudedeepseekgeminigpt-5perplexity
Einn þróandi setti upp Nginx-miðstjórn til að beina fyrirspurnum frá einni vefsvæðisviðmóti til ChatGPT frá OpenAI, Claude frá Anthropic, Perplexity.ai og Gemini frá Google, og síðan skoðaði aðgangsferilskrárnar til að bera saman hvernig hver þjónusta hefur hegðun undir einsdæmum umferð. Yfir 12 klukkustunda tímabilið skráði miðstjórnin 4 milljónir beiðna, sem sýndu miklar munur í beiðnistær, útför og villumynstur sem fara fram úr yfirlýstum módelsskörum. Beiðnir ChatGPT áttu í meðal 210 ms umferðartíma, með stöðugu 99% árangursþýðingu, en hver beiðni flutti 2-KB JSON-nytjargarð sem innihélt "módel"-reit og token-tal-vísbendingu. Umferð Claude sýndi svipaða meðalútför, 280 ms, og hærri hlutfall 429 "takmörkun" svar, sem bendir til strangari per-minútu kvótu á frítt stig. Endapunktur Perplexity, markaðssett sem rauntíma svaravélin, framleiddi minnstu nytingargörðina (≈1 KB) en þjáðist tímabundnar 500 villur sem stóðu þegar fyrirspurninni var óskýr orðalag. Gemini, nýasti þátttakandinn, sýndi lengstu bógur - 15% af beiðnum yfir 500 ms - en ferilskránni sýndi samfellu notkun á HTTP/2 vefþjóns hrindi, sem bendir til að streymisvörsvæði gæti dregið úr klient-hliðar-útför á kostnað hærri vefþjóns notkun. Það sem má að meta: sem margir LLM-framsýnir á Norðurlöndum fjölgar, þá byggja þróendur síðar og síðar á sameiginlegri brautarkirti til að miðla API-umferð. Gögnin sýna að kostnaður, áreiðanleiki og árangur eru ekki einhæfir á milli þjónustuveitanda; módel sem vinnur metorðablaði getur ennþá sett þyngra bandbreidd eða strangari þröskuldar í framleiðslu. Fyrir fyrirtæki sem áætla að innbyggja AI-aðstoð í viðmóti við viðskiptavini, gætu þessir felldir starfsfræðilegir munir haft áhrif á SLA og skýjaborgarútgifter. Það sem á að horfa á næst: höfundur áætlar að endurtaka tilraunina með komandi Gemini "hybrid inference" ham, sem tilkynnt var 20. apríl, og að prófa áhrif token-stigs streymis á Nginx buffer-notkun. Áhorfendur eiga einnig að fylgjast með breytingum á stefnum á OpenAI og Anthropic sem gætu endurtekið þröskuldar, auk þess sem evrópsk lög um gagnvernd geta þvingað innanvæði-dómar, þátt sem var vísað í 16. apríl í skýrslu okkar um Firebase-lykilorán.
60

31 víddir fréttahneigðar, fyrirspurnanlegar í einfaldri ensku frá Claude

Dev.to +5 heimildir dev.to
biasclaude
Claude, forystumódel Anthropic í samtalsgervigreind, býður nú notendum upp á að rannsaka fréttagreinar eftir 31 mismunandi víddum hneigðar með einföldum enskum skipunum. Uppfærslan kemur í stað iðnaðarmælisins sem byggir á einu “vinstri‑hægri” skor, og setur í staðinn fram fjölvíddar flokkun sem inniheldur valhneigð, rammavinnslu, fjölbreytni heimilda, tón, útelátur og áherslu á frásögn, meðal annars. Notendur geta beðið Claude um að “listi upp rammavinnsluhneigð í þessari sögu” eða “varpa ljósi á allar valhneigðir”, og módelinn skilar kerfisbundnu broti með tilvitnunum úr textanum. Aðgerðinni er mikilvægt að segja, því núverandi verkfæri til að greina hneigð flattar flókin ritstjórnunarmál í eitt tölugildi, sem dular felur í sér hvernig fjölmiðlar móta skynjun. Með því að sýna ríkari hneigðarkort, veitir Claude blaðamönnum, staðfestendum og lesendum greiningarljósi sem speglar fræðilegar rammir um fjölmiðlahneigð eins og AllSides og Media Bias/Fact Check, en með tafarlausri, AI‑knúinni greiningu. Fyrri skuldbinding Anthropic til “stefnumálstengdar jafnræðis” í Claude, sem var útfærð í 2026‑kynningunni um þjálfun á hneigð, fær hér raunverulega notkun, og lofar meiri gegnsæi og ábyrgð í skýrslugerð. Það sem á eftir er að fylgjast með er hvernig 31‑víddakerfið er staðfest og tekið upp. Anthropic hefur opnað eiginleikann fyrir þróunaraðila í gegnum Claude API, og býður upp á innleiðingu í stjórnborð fréttastofa, vafraviðbætur og menntunarvettvang. Sjálfstæðir endurskoðanir eru líklegar til að meta nákvæmni miðað við mannlegar hneigðarlistanir. Ef tækið reynist áreiðanlegt, gæti það orðið staðlaður hluti í fjölmiðlunarfærniáherslum um allan Norðurlönd og víðar. Á hinn bóginn gætu útgefendur mótmælt og haldið því fram að merkingar um hneigð í algrímum gætu verið misnotaðar. Næstu vikur munu sýna hvort nákvæm hneigðarljósi Claude breyti samtalinu um trúverðugleika frétta eða bæti enn eitt lag við áframhaldandi umræður um AI‑stýrða innihaldsstýring.
60

Kenna Alfred að muna með taugavís

Dev.to +5 heimildir dev.to
agents
Kenna Alfred að muna með taugavísindainnblásnu minniskerfi fyrir gervigreindarþjóna
59

Forritarar varða að láta Claude Code framkvæma verkefni sem þeir geta sjálfir

Forritarar varða að láta Claude Code framkvæma verkefni sem þeir geta sjálfir
Mastodon +6 heimildir mastodon
claude
Varúðarbylgja hefur brest á samfélagsmiðlum eftir að þekktur forritari gaf skýra viðvörun um Claude Code frá Anthropic. Í þræði sem fljótt varð vinsæll lofaði höfundurinn nýjustu betrumbótum en lagði áherslu á „hart stopp“: notendur ættu ekki að láta Claude Code taka að sér verkefni sem þeir geta sjálfir unnið. Rökstuðningurinn er tvíþættur – áreiðanleiki á módelinn minnkar persónulega færni og, enn mikilvægara, er ekki hægt að sannreyna úttakinu fullkomlega, sem gerir verkefni viðkvæm fyrir falnum villum eða illgjarnum kóða. Viðvarunin kemur í þeim tíma að Claude Code er talinn byltingarkenndur lausn fyrir bæði reynda forritara og ótekniskir notendur. Árið áður kynnti Anthropic Claude Design, viðbót til sjónrænnar frumgerðar, og sérstök rannsókn leiddi í ljós að Claude Desktop viðskiptavininn setti í leynilegri mynd fjarskiptagögn. Þessar upplýsingar, ásamt nýlegri afturhönnun sem sýndi að 98,4 % af Claude Code kóðagrunninum samanstendur af eignarhalds „rekstrarhönnun“ íhlutum, hafa þegar kveikt umræður um gagnsæi og öryggi. Af hverju viðvarunin skiptir máli er að loforð Claude Code um gervigreindarstuðlaða forritun er sífellt meira innifalið í fyrirtækjaferlum og kennslukerfum um allan heim í nordeikju. Ef forritarar taka inn framleiddar kóðaútdráttar án nákvæmrar yfirferð, eykst áhættan á að dreifa fínum öryggisgöllum eða röngum rökum, sem gæti undirstattu framleiðniávinninginn sem tækið lofar. Það sem þarf að fylgjast með næst eru svör Anthropic og möguleg stefnumótun. Fyrirtækið hefur bent á strangari sandkassa og nákvæmari „útskýrðu rökstuðninginn“ eiginleika, en raunveruleg útgáfudagsetning er óljós. Greiningaraðilar munu einnig fylgjast með hvort helstu þróunartól (IDE) birti Claude Code djúpt, sem gæti aukið áhrif núverandi varúðar. Samræðan varpar ljósi á víðari spurningu um AI‑aukað hugbúnaðarmarkað: hvernig á að jafna hraða og ábyrgð.
54

OpenAI styrkir lög sem vernda fyrirtækið ef AI veldur mannsfalli og öðru óreiðu

Mastodon +7 heimildir mastodon
chipsinferenceopenaitraining
OpenAI hefur lagt sitt óskipta þyngd bak við Illinois-löggjöf sem myndi vernda AI-framleiðendur fyrir borgarlegri ábyrgð þegar kerfin þeirra valda „þungum skaða“ – sem er skilgreint sem dauði eða alvarleg meiðsla 100 eða fleiri manna, eða eignatjón sem fer yfir 1 milljarð bandaríkjadala. Lögin, sem voru kynnt í ríkishúsinu snemma þessa mánaðar, ætla að veita almenna varnarreglu fyrir fyrirtæki sem nota módel sín í hættuhegðunum, allt frá sjálvstýrum farartækjum til greiningar í læknisfræði. Almenningsyfirlýsing OpenAI, sem birtist á fyrirtækisblogginum og var dreift í þýðingarboði, setur fyrirtækið sem frambjóðanda í baráttunni til að takmarka lögfræðilega áhættu fyrir AI-tækni. Þetta málið er mikilvægt því það merkir fyrsta samræmda árangur stórs AI-fyrirtækis til að hafa áhrif á lög um ábyrgð á ríkishátt. Gagnrýnendur argumenta að slíkt ósnertisorð gæti dregið úr hvatningum til öryggisprófana og yfirgefi særða án möguleika á að krefja, en iðnaðarvarnar mála að það sé nauðsynlegt til að efla nýsköpun í sviði þar sem óútreiknanlegar mistök geta haft því versta afleiðingar. Umræðan endurtekur eldri baráttur um AI-ábyrgð, þar á meðal nýlega OpenAI-stuðning við netvarnarmódel sem vakti reglugerða-vopnabaráttu við Anthropic, og eigin reynslu fyrirtækins með skyndilegum breytingum á þjónustu sem ollu því að þróunarvinnu fóru í óvissu. Lögin eru nú undir umræðu í nefndum og líklegri átökum við neytendur og tryggingareglugerð. Verður að fylgjast með vitnisburði frá framkvæmdastjórum OpenAI, andstöðu frá lögfræðingum sem berjast fyrir mannréttindum, og hvaða federala viðbragði sem gæti komið í veg fyrir ríkishætti. Úrslitin munu sýna hversu langt lagafræðingar eru tilbúnir að fara í að veita lögvernd AI-skaparum, og gætu sett framminn fyrir svipaðar lög í öðrum löndum þar sem iðnaðurinn er að berjast við vaxandi ógn AI-valda mannsfalls.
54

GPT-5.4-Cyber: Nýr liður í öryggi og varnir gegn árásargögnum frá OpenAI

Dev.to +6 heimildir dev.to
autonomousgpt-4gpt-5openai
OpenAI hefur formlega sett GPT-5.4-Cyber á markað, sérstaka stóra tungumálamódel sem er byggt til að sjálfvirkna áhættugreiningu, skrifa varnarkóða og skipuleggja árangursleitir. Útgáfan, sem var tilkynnt í stuttum bloggpósti og beinni sýningu þann þriðjudag, kemur aðeins viku eftir að fyrirtækið var gert að meta ábótavant sem módelið var tilbúið og hættuna á að það myndi útbreita mörk milli varnargögna og árásargögna. Framkvæmdastjóri OpenAI, Sam Altman, varði tímaútgáfu módelins og sagði að það hefði staðist innri rauðliðaþjálfun og væri nú tiltækt tryggðum öryggisliðum gegnum nýja Assistants API. Frumsýningin er mikilvæg þar sem hún merkir fyrsta skiptið sem stór AI-rannsóknarstofa hefur markaðssett módel sem er aðallega byggt til að styrkja stafræna undirvötn. GPT-5.4-Cyber getur tekið inn hrá logg, búið til Snort-reglur, lagfært sárbær kóðabitar og jafnvel líkist snyrtílop fyrir þjálfun, allt án þess að fara útaf sandkassavinnuumhverfi. Með því að innbyggja módelið í Öryggis-aðgerðamiðstöðvar gætu fyrirtæki minnkað greiningartíma frá klukkustundum til mínútna, sem gæti breytt efnahag öryggisvarnar. Á sama tíma vekja sömu getu áhyggjur um vopnun; gagnrýnendur vara við því að sama kóðageneratoren gæti verið endurnýttur af áhættuþáttum, sem gæti versnað AI-vopnavettvanginn sem reglugerðaraðilar eru að hefja að takla. Tíðindi OpenAI um GPT-5.4-Cyber 16. apríl högnuðu á tæknilegum eiginleikum en skiluðu opna spurningu um hvernig þjónustan myndi verða aðgangsheimill. Verið varða útgáfu "Öryggis-aðgangsáætlunar" OpenAI, sem mun krefja bakgranns athuganir og notkunarmálsfæribækur, og fyrir viðbrögð frá iðnaðarkeppinautum eins og Anthropic og Azure Sentinel-liði Microsoft. Jafn mikilvæg verða stefnuyfirlýsingar frá AI-löggjafanefnd Evrópu, sem er væntanleg til að gefa út leiðbeiningar um háhættu-AI-módel á sumrin. Næstu mánuðir munu sýna hvort GPT-5.4-Cyber verður hornsteinn fyrirtækjaöryggis eða útbreidda nýjar reglugerðarbaráttur.
54

Nyx - ógnarþjálfi fyrir AI-aðgerðir með margar snúningar og aðlögunarhæfni

HN +6 heimildir hn
agentsautonomous
Nyx, opinn ógnarþjálfi sem var kynntur á Hacker News, lofar að þróa AI-aðgerðir með sömu ágangi og skapandi afköstum og raunverulegir notendur eða ógnir gera. Tólfið keyrir margar snúningar og aðlögunarhæfar samræður gegn markmiðsaðgerð, og athugar í þeim tilgangi að finna skilruglingabugs, brot á fylgni fyrirskipunum, hegðun í útröndum og klassískar rauðliðsárásir eins og útbrot, innskot og tólaupnám. Nyx starfrækir sem hreinn svartkassakerfi, án þess að þörf sé á aðgang að innri hlutum módelins, sem þýðir að þróunarfræðingar geta metið á hverja aðgerð sem keyrð er á staðnum eða er hýst á sama hátt og endanotendur gera. Útgáfan kemur á tíma þegar AI-aðgerðir eru að fara úr rannsóknarúrgöngum yfir í framleiðsluvænar aðstoðarverkfæri, kóðageneratöra og sjálfbærar ákvarðanatöku. Sem aðgerðir fá aðgang að tólum og ytri API, þá víkka árásaryfirborðið mjög, og nýlegar skýrslur um innskotshættir hafa undirstrikað þörfina fyrir skipulagða, sjálfvirkja öryggisathugun. Margra snúninga geta Nyx greinir hana frá stöðnu innskotshættum, og gerir henni kleift að aðlaga sér til aðlögunar á móti aðgerðarviðbrögðum og til að líkja eftir langvarandi andstæðingum sem endurspegla raunverulegar árásir. Iðnaðarathugunarmenn sjá Nyx sem hluta af vaxandi "AI-ógnarbyltingu", þar sem tugir af árásaröryggisvélum eru gefnar út til að kortleggja og styrkja svæði ógnarvarna í kerfum sem eru knúin af stórum tungumálamódelum. Svartkassahönnun hennar lækkar þröskuld fyrir minni liði til að taka upp kröftuga prófanir án dýra innviðabreytinga, sem gæti sett nýtt staðal fyrir þróunarpípur AI-aðgerða. Það sem á að horfa á næst: fyrstu notendur munu líklega birta prófunar Niðurstöður sem bera saman Nyx við núverandi rauðliðsrammagerð, og verkefnisgeymslu GitHub verkefnisins gæti dregið að sér samfélagsskipaðar viðbótar fyrir fjölnýtt aðgerðir og tólanotkunarscenaríur. Ef Nyx fær fótfestu, gæti hún þrýst á AI-þjónustuveitendur til að innbyggja svipaðar varnir í sína verkvangi, og myndi þá næstu bylgju öryggis og trausts í aðgerðaútgáfum.
53

GitHub Copilot með Claude Code: Norrænn forritari deilir reynslu

Mastodon +6 heimildir mastodon
claudecopilot
Ráðandi hugbúnaðarverkfræðingur í miðstórum norrænum SaaS-fyrirtæki hefur gefið út opinská ummæli eftir nokkur mánaða daglegan vinnu með GitHub Copilot, þar sem þjónustan notar nú Claude Code í bakgrunni. Forritarinn segir að AI‑parforritarinn hafi breytt verkefnum sem áður tóku mörg daga í málefni sem klárast á nokkrum klukkustundum, þar sem grunnkóði, prófunarrammar og API‑klientagenerering eru minnkuð í nokkur lyklaslag. Hraðaukinn er raunverulegur, en höfundurinn varar við því að tækið verði notað íhugað – frá yfirferð á framleiddum brotum til öryggisviga til að fylgjast með leyfisfótsporum í þjálfunargögnum undirliggjandi módelins. Skiptið yfir í Claude Code er mikilvægt þar sem það er fyrsta stórstæð útbreiðsla Anthropic‑módelins innan Copilot hjá Microsoft, skref sem gæti umbreytt samkeppnisumhverfi milli OpenAI‑miðaðra og Anthropic‑miðaðra verkfæra. Fyrir fyrirtæki sem hafa þegar hafið stjórnun notkunar á Claude í verkfræðiteymum – sjá skýrslu okkar frá 20. apríl um Claude‑kóðastjórnun – staðfestir reynslan framleiðsluáhrifin en varpar einnig ljósi á sömu stjórnunaráskoranir: uppruni kóða, samræmi við opna hugbúnaðarleyfi og áhætta á afritunarvillum í óathugunargjöfum. Það sem á eftir að fylgjast með er hvernig bæði GitHub og Anthropic bregðast við þróuninni. Við væntum nánari IDE‑samþættingar sem sýna upprunaupplýsingar, víðari stefnu­stýringartöflur eins og staðbundið fjölverkefna stjórnborð sem fjallað var um áður, og mögulega nýjar leyfisupplýsingar í FAQ Copilot. Stærri fyrirtæki eru líkleg til að prófa strangari eftirlitsgötur fyrir AI‑framleiddan kóða, á meðan sprotafyrirtæki geta nýtt sér hraðkostina. Næstu fjórðungar munu sýna hvort afkastaaukningin vegi upp á rekstrarkostnaðinn, og hvort Claude‑knúinn Copilot verði sjálfgefinn AI aðstoðarmaður fyrir norræna forritara.
53

Skelfileg þróun: einfaldir starfsmanna framleiðnimælikvarðar í boði

Mastodon +6 heimildir mastodon
Sænskt sprotafyrirtæki, FocusAI, kynnti skýjabundið þjónustu sem segir sig geta dregið fram „einfaldir starfsmanna framleiðnimælikvarðar“ úr daglegum stafrænum slóðum – tímasetningum í tölvupósti, spjallskrá, kóðasendingum og dagatalsfærslum – með því að nota stórt tungumálalíkan fínstillt á fyrirtækjagögnum. Verkefnið, markaðssett sem „Instant Insight“, lofar stjórnendum eitt‑smell skorið sem á að endurspegla hversu mikið „djúp vinna“ hver starfsmannur framkvæmir, og setur mælikvarðann í stað hefðbundinna þátttöku kannana. Tilkynningin kom í kjölfar bylgju af mannauðstækni sem endurhugmyndar frammistöðumat í gegnum gervigreind. Nýlegar greiningar hafa bent á „einbeitingartíma“ sem áreiðanlegasta vísir á framleiðslu og sem verkfæri gegn úrrími, á meðan gagnrýnendur varða að minnka flókið framlag í tölulegt gildi geti leitt til smástjórnar og eyðileggingar persónuverndar. Aðferð FocusAI eykur þessar áhyggjur: með því að safna saman mínútu‑by‑mínútu virkni fer kerfið á milli greininga og eftirlits, eins og BusinessToday greinaði og lýsti slíka nákvæma skráningu sem arfleifð yfirþyrmandra miðstjórnakultúrs. Afleiðingar eru tvíþættar. Fyrst gæti varan flýtt fyrir innleiðingu gervigreindarbættra frammistöðustjórnunartöflna, sem myndi breyta því hvernig skandinavísk fyrirtæki úthluta auðlindum og meta hæfileika. Í öðru lagi vekur hún lagaleg og siðferðileg spurningar í ljósi væntanlegra AI-laga ESB, sem flokka háskaða kerfi sem hafa áhrif á réttindi starfsmanna. Verkalýðsfélög í Danmörku og Svíþjóð hafa þegar sýnt vilja til að mótmæla notkun sem skortir gagnsæja samþykktarferla. Áframhaldandi þróun felur í sér prófunarútgáfu FocusAI hjá nokkrum tæknifyrirtækjum, viðbrögð gagnaöryggis yfirvalda og hvort samkeppnisaðilar snúi sér að nákvæmari mælikvörðum eins og einbe
53

Opinber uppskriftasafn fyrir OpenClaw með viðbótum og hæfni

Opinber uppskriftasafn fyrir OpenClaw með viðbótum og hæfni
Mastodon +6 heimildir mastodon
privacy
Þróunarlið OpenClaw hefur birtað nákvæman leiðbeiningar um framleiðsluvænu útgáfur sem tengja plugins kerfisins við vaxandi safn "hæfna". Skjalið, sem var birt á vef Glukhov um vélamennsku kerfi, kortleggur raunverulegar uppsetningar í notendaflokkum - frá afþreyingarstofum til fyrirtækja gögnamiðstöðva - og sýnir hvernig á að sauma saman endurnýjanlegar hæfnabúnta, plugins útiloka verkfæra og margra aðila samstillingu á sama tíma og varðveita áreiðanleika, lágan láti og ströngu einkamálgæðir. Leiðbeiningarnar eru fyrsta fastmóta arkitektúr leikveldið fyrir OpenClaw, opinn og sjálfsþjálfaður LLM aðstoðarforrit sem hefur verið að vinna vinsældir á Norðurlöndum fyrir staðbundnar einkamálsgæðir. Það leiðir lesendur í gegnum containeríska útgáfur (Docker Compose fyrir smá liða, Helm charts fyrir Kubernetes klústrar), uppfærslur án niðurstöðu gegnum snúningaútgáfur, heilsutölvumellu og óhæðarvarnarmynstur eins og ástandsskot og sjálfvirkar hæfnabakfærslur. Öryggisþéttingar - sandboxað plugin keyrsla, undirskrifaðar hæfnupakkar og áritunarskrá samþætting - eru hafðar fram ásamt uppskali ráðum eins og skiptingu á útköllum og hleðslujöfnun hæfnastarfa. Það er mikilvægt af tveimur ástæðum. Fyrst, lækkar leiðbeiningarnar tæknilegan þröskuld fyrir stofnanir sem vilja skipta um sky-only AI þjónustu fyrir staðbundna stjórnkerfi, breytingu sem er þjóðin af GDPR-strengjuðum gagnaeignarréttindum. Annar, byggir hún á vistkerfinu sem við kynntum síðasta viku með OpenClawdex, UI samstillingu fyrir Claude Code og Codex, og hæfnastandard sem kom fram í okkar "Hæfni yfir módel" yfirliti 19. apríl. Með því að mynda besta venjumynstur getur OpenClaw núna keppa beint með einkareknum boðum sem byggja á einkaeignarundirbúningi. Í framtíðarútsýni er samfélagið þegar að semja útgáfu 2.0 af OpenClaw, sem lofar innbyggðum athugunardvölum og þéttari samþættingu við OpenClawdex notendaviðmót. Halda augum á fyrstu notendur í fjármálum og heilbrigðisþjónustu sem birta árangursmælikvarða, og á "awesome-openclaw-hæfni" geymsluútvíkkun, sem gæti orðið að verða de-facto markaður fyrir plug-and-play AI getu. Næstu mánuðir munu sýna hvort OpenClaw geti þýtt opinbera hugbúnaðarhrandi sitt yfir í fyrirtækjatrust.
51

Getur Claude skrifað Z80 samsettakóða?

HN +5 heimildir hn
claude
Anthropic’s Claude hefur verið prófað í klassískri retro‑tölvuáskorun: að skrifa Z80‑samsettakóða. Hackaday‑greinin sem kom út í þessari viku sýnir notanda sem beindi Claude‑Code til að framleiða litla rútínu sem kveikir á og af porti og framkvæmir einfalt biðslúppu. Líkanið skilaði setningafræðilega réttum Z80‑kóða, með réttum notkun á skráum, flaggaathugunum og “JR” skipuninni, og bætti jafnvel við athugasemdum sem útskýra hvert skref. Eftir stutta handvirka yfirferð var brotinu þýtt með opna “z80asm” þýðandanum og keyrt á raunverulegum Z80‑borði, sem staðfesti að úttakið var virkt. Tilraunin er mikilvæg því Z80‑samsettakóði stendur á hinum enda forritunarviðhorfsins frá þeim háþróuðu tungumálum þar sem stóru tungumálalíkön (LLM) hafa sýnt mestan ávinning. Að búa til lágnivåskóða krefst nákvæmrar þekkingar á skipanalistum, vistfangsham, og sértækum eiginleikum vélbúnaðar – svæði þar sem ein skekktur stafur getur gert forrit ónotanlegt. Árangur Claude bendir til þess að nýja “Claude‑Code” útgáfan, sem tilkynnt var 19. apríl, sé að víkka hæfni sína út fyrir hefðbundna vef‑forrit eða Python‑brot til sviðs ígræðslu- og áhugamannaforritunar. Fyrir norðurlanda AI‑samfélagið, þar sem líflegur maker‑umhverfi byggir enn á 8‑bita örgjörvum til menntunar og listrænnar uppsetningar, gæti áreiðanlegur AI‑aðstoðarmaður flýtt fyrir frumgerðarferlum, lækkað hindrun nýliða og einfaldað villuleit í eldri kóða. Það sem á eftir að fylgjast með er hvort Anthropic muni formlegja lágnivåskóðagerð með sértækum fyrirmælum, nánari samþættingu í IDE‑um eða sérsniðna “Claude‑Assembly” lausn. Viðmiðunartölur sem bera saman Z80‑úttak Claude‑Code við GitHub Copilot eða OpenAI‑líkön munu skýra samkeppnisforskotið. Á sama tíma gætu samfélagsverkfæri eins og opna “OpenClawdex” stjórnunarkerfið fljótlega bætt við viðbótum fyrir retro‑CPU vinnuferla, og breytt AI‑hjálpaðri samsetningu úr nýjung í reglulegan hluta áhugamannaverkfæra. Eins og við skýrðum um útgáfu Claude‑Code 19. apríl, er þessi Z80‑prófun fyrsta áþreifanlega sönnunin á því að líkanið getur sinnt fjórðungum smáatriðum hugbúnaðarþróunar.
50

Nýir reglur gegn sjálfvirkri myndlist í Playdate-leikjum

Mastodon +6 heimildir mastodon
Panic, framleiðandi vinsæla Playdate-leikjatölvunnar, hefur þröngvað reglur sínar um leikjaútbreiðslu til að banna alla leiki sem nota sjálfvirkri myndlist (AI) til að búa til sjón-, hljóð-, tón-, texta- eða samtalsefni. Áætlunin, sem tók gildi í apríl 2026, krefur þróunarfræðinga að tilkynna notkun AI á sérstökum valmöguleikum á meðan á útbreiðslunni stendur; leikir sem nota AI-aðstoð í forritun eru enn leyfilegir, en þeir munu bera skýran "AI-aðstoð" merkingu. Ákvörðnin merkir að Panic vilji varðveita einkennandi, handsmíðaða útlit Playdate-tölvunnar og halda samfélagið í heilu. Co-aðalstofnandi fyrirtækisins, Cabel Sasser, sagði The Verge að fyrirtækið "hafi enga áhuga á vörum sem eru búnar til með sjálfvirkri myndlist", og rökstuðlaði að ótakmörkuð AI-úttak gæti flætt Catalogið með lágkostnaðar-, einræktuðu efni og dregið úr listrænum staðli vettvangsins. Með því að leyfa AI aðeins í forritunarskeiðinu, setur Panic mörk milli aðstoðar- og skapandi myndlistar. Ákvörðnin kemur í kjölfar víðari iðnaðar-endurskoðunar yfir AI-myndlist. Útgefendur eru að berjast við höfundaréttar-óvissu, tekjukerfi og áhættu þess að eyða virði höfunda. Fyrir Playdate-kerfið, sem er þétt af sjálfstæðum leikjaaðstöðum, neyðir banninn þróunarfræðinga til að velja á milli hefðbundinna efnisflæða eða hýbríða-vinnslu sem heldur AI utan lokaefnis og hljóðs. Minni stofnanir gætu átt við hærra framleiðslukostnað að stríða, en þeir sem eru þegar fjárfestir í AI-tækjum verða að endurskoða eða riska að vera lokaðir út frá opinberum verslunum. Það sem á að horfa á næst: samfélagið svarar á vefþræðum og félagsmiðlum, og hvort bylgja "AI-lausrar" leikja muni koma fram sem seldingapunktur. Aðrar nísku-vettvangar, eins og Analogue Pocket-uppfærslur og endurmiðaðir app-verslanir, gætu tekið upp svipaðar takmarkanir ef ákvörðun Panic virðist vinsæl. Að lokum gæti réttarleg athugi verið beint að skilgreiningu "AI-aðstoðar-forritunar" í mun að "AI-myndlist", sem gæti leitt til reglugerðar-vegleiðingar sem gæti endurskapað hvernig leikjatölvur meðhöndla sjálfvirkri tækni.
50

Næstu útgáfur af Mac Studio og MacBook Pro gætu verið frestarar um nokkra mánuði

Mastodon +6 heimildir mastodon
apple
Apple gæti frestað útgáfu næstu kynslóða Mac Studio borðtölvu og væntanlega snertiskjáa MacBook Pro um nokkra mánuði, segja greiningaraðilar. Eftirlitendur á framboðsrás, undir forystu Mark Gurman, benda á viðvarandi skort á háþróuðu silíki og minni einingum sem neyðir Apple til að fresta nýja Mac Studio – sem áætlað er að kynna M5 Max og M5 Ultra örgjörva – frá venjulegu voratímabili til um það bil októbers. Sömu takmarkanir eru væntanlegar að hafa áhrif á næstu MacBook Pro, þar sem orðspjall segir að hún muni sameina nýja M5 örgjörva fjölskyldu með fyrsta innbyggða snertiskjá. Frestunin er mikilvæg vegna þess að nýju Mac tölvurnar eru settar fram sem aðal vélbúnaðarvettvangur fyrir AI‑intensívar verkefni sem margir þróunaraðilar og fyrirtæki treysta á. M‑raðar örgjörvar Apple hafa orðið sjálfgefinn hröðunartæki fyrir stórmálmódel á tækinu, þróun sem var dregin fram í nýlegum greinum okkar um útbreiðslu OpenAI’s “Codex Desktop”. Seinni útgáfa gæti seinkað útbreiðslu AI‑bættra
48

Anthropic lokaði aðgangi Claude hjá fyrirtæki með 60 reikninga

Anthropic lokaði aðgangi Claude hjá fyrirtæki með 60 reikninga
HN +6 heimildir hn
anthropicclaude
Anthropic lokaði skyndilega aðgang að fleiri en 60 Claude-reikningum sem tilheyra argentínsku fjármálatæknifyrirtækinu Belo, og vakti opinberar kvartanir frá tæknistjóri fyrirtækisins, Patricio “Pato” Molina. Í færslu á X deildi Molina skjáskoti af tölvupósti frá Anthropic þar sem stendur að „sjálfvirkar kerfislausnir okkar greindu mikla fjölda merki tengd við reikninginn þinn sem brjóta notkunarstefnu okkar“, en engar nánari upplýsingar um áætlaða brotið voru gefnar og aðeins var boðið upp á almennan Google‑eyðublað til kvörtunar. Lokunin gerði innri vinnuferla Belo óvinnanlega, þar sem Claude er notaður í allt frá sjálfvirkri þjónustu við viðskiptavini til áhættugreininga. Verkfræðiteymi fjármálatæknifyrirtækisins tilkynnti að sviptingin tókst í framkvæmd án fyrri fyrirvara, og gerði það forritara ófær um að nálgast mikilvæga AI‑knúna verkfæri í gegnum fyrirtækið. Molina varaði aðra hugbúnaðarfyrirtæki um að „aldrei setja öll eggin í einn körfu“, og lagði áherslu á viðkvæmni þegar einu LLM-þjónustuveitanda er treyst. Atvikið er mikilvægt vegna þess að það varpar ljósi á ógegnsæi í framfylgd AI‑þjónustuveitenda. Notkunarstefnu Anthropic hefur áður vaknað athygli eftir skýrslur um „njósnabrú“ sett á notendatölvur, og fljótt, sjálfvirkt lokun reikninga vekur spurningar um réttindi og nægjanlegan réttarbúnað fyrir fyrirtækjakunderi. Fyrir fjármálatæknifyrirtæki sem vinna með viðkvæmar fjármálaupplýsingar getur óvænt tap á AI‑getum leitt til rekstraráhættu, samræmisvandamála og mögulegs tekjutaps. Hvað á eftir að fylgjast með: Lögfræðiteymi Anthropic er líklegt til að bregðast við, mögulega með skýringum á þeim stefnumörkum sem leiddu til fjölda sviptinga. Greiningarmenn í greininni munu fylgjast með hvort stjórnvöld íhluti, sérstaklega í ljósi nýja AI‑löganna í ESB. Á sama tíma eru fjármálatæknifyrirtæki og önnur fyrirtæki líkleg til að flýta fyrir fjölbreytniáætlunum, með innleiðingu annarra LLM-kerfa eins og Claude Design, OpenAI‑GPT‑4o eða staðbundinna evrópskra líkananna til að draga úr áhættu við einan birgi. Atvikið gæti einnig hvatt til víðtækari umræðu um gagnsæja AI‑stjórnun og staðlaða kvörtunarferla í greininni.
45

Ég byggði BaaS þar sem AI-aðilar geta skráð sig sjálfir

Dev.to +6 heimildir dev.to
agentsautonomous
Vibebase hefur kynnt til sögunnar sjálfskjár Backend-þjónustu (BaaS) sem útbýr AI-aðila með fullri rafrænni einkenni – með netfangi og skilgreindum þjónustuleyfum – án þess að vera nauðir að afhjúpa óvernduð API-lykla. Plattforminn skráir sjálfkrafa nýja aðila, útbýr þeim með minnstu réttindum og skráir alla aðgerðir í áreiðanlegri feril; mannlegur stjórnandi getur síðar tekið yfir eignarrétt yfir aðila sem hefur verið tilbúinn. Ákvörðunin taklar verkþrá sem hefur plagað forritara síðan á upphafsárunum af sjálfbærir aðilar. Þann 20. apríl, birtum við greinina „Hættu að gefa AI-aðilum AWS-aðgangslykla: Betri leið til að tryggja aðgang“, að gefa aðilum óvarðaða lykla skapi ótrúlega stórt árásarsvið. Með því að gefa út einkenni-bundið merki í stað staðfesta leyndarmála, eyðir Vibebase áhættu af aðgangslyklalekum á sama tíma og aðila er leyft að kalla ytri þjónustur eins og netfang, geymslu eða greiðslulykla. Aðferðin fellur einnig í takt við nýja fyrirætlun um samræmi fyrir BaaS-veitendur, sem leggur áherslu á sameiginlega ábyrgð og áreiðanleika í regluðum geirum eins og fjármálum og heilbrigðisþjónustu. Út fyrir öryggi, lofar sjálfskjármódelið að hraða AI-knúinni vöruþróun. Lið geta keypt hundruð sérhæfðra aðila eftir þörfum, hver um sig einangraður með eigin einkenni, og síðar afhentir sérfræðingum til afköstun eða viðskiptaþjónustu. Fyrra notendur í fjármálageiranum hafa þegar sagt að þeir hafi fengið fljótar markaðssetningartíma fyrir svikamála-öryggisvætti, á meðan prófun í HIPAA-samræmdri fjarnþjónustuplattform segir að hafa fengið sléttara áreiðanlega feril og minnkað DevOps-útlág. Hvað á að horfa á næst: hvort stórir skýjaveitendur munu birta samanburðarleg einkenni-þjónustu fyrir aðila, hvernig reglufyrirkomar munu svara við sjálfbærri aðilaskráningu í háðáttasviðum og hvort keppinautar munu taka upp svipaða merki-bundna skráningu til að mæta blöndu Vibebase af sjálfbærni og stjórnun.
45

Frumlegir lokala LLM eru orðnir góðir og ég svaraði ekki við þeim

Mastodon +7 heimildir mastodon
Grein á XDA-Developers með titlinum „Lokala LLM eru orðnir góðir núna og ég svaraði ekki við þeim í mánuðir“ hefur vakið nýjan umræðu um ágæti lokala, generatíva gervigreindar. Höfundur greinarinnar, langtíma LLM-tæknir, skráir hvernig módel sem Qwen-3, Llama 3 og Google's Gemma 2 eru núna keyrð á notendanæmum hraða á almenningslöptöppum og jafnvel mið-röðarskíkum, þakka þróun í kvantun, llama.cpp-keyrslu og nýjasta GPU/CPU-hröðunum. Greininni er lýst að tímabil „skýja-aðeins“ útköllun sé að líða undir lok: fyrirhleðslutími fellur frá sekúndum í millisekúndur, API-reikningar minnka verulega og viðkvæm gögn fara aldrei úr notandavélinni. Breytingin má ekki undirstrika, af því að hún hefur áhrif á fjölda þátta. Fyrst og fremst, hún ógörir ríkjandi tekjustróma þeirra sem kosta per-tók, sem getur endurtekið markaðinn fyrir gervigreindarþjónustu í Evrópu og Norðurlöndum þar sem gögn-heimild er stefnumótunarpriorítet. Önnur, kostnaðarförðunin - keyra módel lokala getur verið fáir dollara á mánuði, í stað tugur eða hundruð fyrir skýjanotkun - gerir gervigreind aðgengileg fyrir smærri upphafsfyrirtæki og áhugamenn sem áður gátu ekki borgað kostnaðinn. Þriðji, notendur sem leggja áherslu á persónuvernd fá í sér staðfestan valmöguleika í stað þjónustu sem hefur nýlega dregið athygli, eins og Anthropic-skríðsvarnari sem var fundinn með telemetri. Það sem á að horfa á næst er vistkerfið sem mun ákvarða hvort upphefðin þýðir varanlega notkun. Búast við skyndilegum frumvörpum af minni, fíngerðum afbrigðum sem eru auðveldar fyrir ARM og Intel-Xeon-vélar, og þéttara samvinnu við framtíðar-vélar eins og Apple's M3 og Nvidia's RTX 4090-klassa GPU. Opinber vélbúnaður er þegar að bæta við stuðningi fyrir lokala LLM-hröðun, og nokkur Norðurlandafyrirtæki hafa tilkynnt um reynslur fyrir lokala LLM-vélbúnaði. Reglufyrirtæki gætu einnig fókrað í öryggisáhrifin af því að keyra kraftmikla módel ólínulega, sérstaklega þegar birgðakeðjuárásir á módel-samþættum verða líklegri. Næstu mánuðir munu sýna hvort lokala LLM verða almenn vinnuvél eða verða fyrir teknískt ævintýri.
42

Samhengisverkfræði fyrir umboðskerfi: Hvað fer í huga umboðsmannsins

Dev.to +6 heimildir dev.to
agents
Rannsóknarsamfélag undir forystu AI Lab við Háskólann í Kaupmannahöfn, með fjármagn frá norðuræskum áhættufjárfestingarfyrirtækinu Northcap, hefur gefið út hvítt blað með titlinum **„Samhengisverkfræði fyrir umboðskerfi: Hvað fer í huga umboðsmannsins.“** Skjalið, sem kom út á þriðjudaginn, leggur fram kerfisbundna nálgun til að móta sífellt vaxandi samhengisglugga nútíma stórrar tungumálalíkana (LLM) í áreiðanlega, markmiðstýrða umboðsmenn. Ritgerðin heldur því fram að raunverulegur byltingarmáttur sé ekki lengur stærð líkanins heldur hvernig forritarar velja og vinna með textann sem líkanið fær í rauntíma. Hún kynna þrjú lög í byggingu—**söfnun, samantekt og framkvæmd**—sem úthlutar vali á samhenginu til sérstaka aðgerða. Nýtt opið kóðasafn, **ContextEngine**, útfærir þessi lög, sker sjálfkrafa niður sögu, dregur saman niðurstöður tóla og setur persónuverndar síur á undan því að fyrirspurnin berist til LLM. Af hverju þetta er mikilvægt núna er ljóst: GPT‑4 Turbo, Claude 3.5 og Gemini 2 hafa ýtt samhengisgluggum yfir 100 þúsund tákna, sem hvetur verkfræðinga til að henda hráum samskiptaskrám inn í fyrirspurnir. Án skipulags í verkfræði verða umboðsmenn óhreinir, dýrir og líklegir til að framkalla skynjunarbrot—vandamál sem var bent á í fyrri umfjöllun okkar um „skugga‑AI“ (2026‑04‑20). Með því að formgera samhengið sem kóða lofar rammann strangari stjórnun, lægri útreikningskostnað og áreiðanlegri hegðun, sérstaklega í hááhættuaðstæðum eins og sjálfvirkri kóðavinnslu, söfnunarbættri framleiðslu (RAG) og fjölumbóta samstarfi. Áframhaldandi þróun: Samfélagið mun bera ContextEngine saman við núverandi RAG ferla í opinberri Kaggle keppni sem fer fram í júní, og nokkrir skýjaþjónustuveitendur hafa þegar sýnt áhuga á að innleiða safnið í stjórð AI þjónustur sínar. Stjórnvöld í EU eru einnig að setja upp leiðbeiningar um „gagnsæi í fyrirmælum“, skref sem gæti gert tillögur ritgerðarinnar að de facto staðli. Eins og við gerðum áður í umfjöllun um vaxandi „skugga‑AI“ vandamálið, gæti hæfni til að endurskoða hvað umboðmaður „veitir“ á hverjum tíma orðið að samræmiskröfu eins fljótt og líkansleyfi.
41

Leikstjóri Mandalorian og Grogu notaði Apple Vision Pro til að forsýna myndina í IMAX-stærð

Mastodon +6 heimildir mastodon
apple
Jon Favreau, leikstjóri á framtíðar-myndinni The Mandalorian & Grogu, hefur tekið þröngan skref í átt að blönduðu veruleika-myndatöku með því að nota Apple Vision Pro augnmörk til að forsýna heildar-myndina í IMAX-stærð. Favreau bað Disney-verkfræðinga að smíða sérstakan Vision Pro-forrit sem streymir fulla upplausnir myndarins á skjá augnmörksins, sem gerir tækin að færanlegu IMAX-bíó. Leikstjórinn getur gengið um sett, skoðað svið í réttu hlutfalli og sýnarsviði sem mun birtast á stóra bíótjöldinu, og gert rauntíma-breytingar á samsetningu, ljósmuni og sjónvirkni. Þessi ákvörðun er mikilvæg þar sem hún sýnir möguleika Vision Pro sem tæki fyrir fræðimenn fremur en neysluvara. Með því að sameina sett-mönnum við virtúel IMAX-skoðun, eykur vinnuflæðið ekki þörf fyrir dýrar eignar-vísunarpróf og getur hraðað framför myndarins fyrir há-kostnaðar framleiðslu. Apple-aðgangur að Hollywood merkir áætlanir til að færa rúm-vélgræðis-plötformuna í skapandi vinnuflæði, sem keppir við yfir-ræði hefðbundinna eftir-vinnslusvíta og keppina AR-lausna frá Meta og Microsoft. Næstu vikur munu sýna hvort tæknið þýðir sýnilegan sjónarhorn í kvikmyndarútgáfuna 22. maí. Iðnaðar-vaktar munu fylgjast með Apple-forritara-uppfærslum á WWDC 2026 fyrir víddaða API sem leyfa öðrum studíum að byggja svipaða tæki. Eigin notkun Disney á augnmörk fyrir framtíðar-verkefni, og yfirlýsingar frá IMAX um að staðla blönduðu veruleika-forsýningar, mun einnig sýna hvort Vision Pro er á leiðinni til að verða fasti hluti á hljóðsviðinu.
41

Mynd úr WWDC 2026 dregur fram stórt iOS 27 eiginleika

Mastodon +6 heimildir mastodon
apple
Apple hefur smyglað inn aðlaðandi mynd í WWDC 2026 sýninguna, sem bendir til þess að iOS 27 muni endurskilgreina heimaskjá iPhone og Siri‑upplifunina. Myndin, sem kom fyrst í ljós á MacRumors, sýnir endurhannaðan uppsetning þar sem forrit, smáforrit og nýja “Smart Stack” geta verið fléttaðar saman á fljótlegri hátt, á meðan þynnri Siri-gluggi situr neðst á læsingarskjánum, tilbúinn að svara samhengi‑spurningum. Viðkvæmur AI‑knúinn “App Suggest” borði birtist einnig og leggur til flýtileiðir byggðar á venjum notandans. Þessi vísbending er mikilvæg því hún merki um mest áberandi UI‑breytingu síðan iOS 15 endurbætti smáforritin og bendir til dýpri samþættingar Apple á eigin stórt tungumálalíkani, oft kallað Apple Intelligence. Með því að innfelda AI‑tillögur beint í heimaskjáinn stefnir
41

Hvernig á að greina hvort Apple AirTag einhvers annars er að rekja þig

Mastodon +6 heimildir mastodon
apple
Apple‑lítið Bluetooth‑merkimið hefur orðið að áreiti í persónuverndarspurningum aftur. CNET birti fimmtudaginn leiðbeiningar skref-fyrir-skref um hvernig notendur geta staðfest hvort óþekkt AirTag sé að fylgja þeim, áminning um að þægindin í tækinu geti verið nýtt til óumbeðinnar eftirlits. Leiðbeiningarnar leiða iPhone‑eigendur í gegnum innbyggða viðvaranir sem voru kynntar með iOS 16.5, þær hljóma með hljóðmerki og sýna tilkynningu þegar AirTag sem er ekki tengt Apple‑auðkenni notandans er í hreyfingu með honum í lengri tíma. Android‑notendur geta sett upp ókeypis “Tracker Detect” forrit Apple til að fá svipaðar viðvaranir. Ef viðvörun birtist, mælir greinin með því að skoða “Items” flipann í Find My, spila hljóð frá AirTaginu og, ef nauðsynlegt er, fjarlægja rafhlöðuna til að óvirkja það. Hún leggur einnig til að skrá númerið á seríutölu og hafa samband við lögreglu, þar sem merkið er hægt að rekja til eiganda í gegnum bakenda Apple. Af hverju þessi leiðbeining er mikilvæg er tvíþætt. Fyrst hefur misnotkun AirTag‑a til áreitni hvatt til fjölsmiðju í fjölmiðlum og lagalegra ágreinings í Evrópu og Bandaríkjunum, sem hefur ýtt Apple til að gefa út hugbúnaðaruppfærslur í lok 2022 sem takmarka hljóðlausa rekjanetími tækisins. Í öðru lagi varpar atburðurinn ljósi á víðtækari spennu milli þæginda mjög lítilla staðsetningarmarka og þörfina fyrir sterka verndarúrræði gegn eftirliti—þema sem hefur endurspeglað í nýlegum fjöri um „skugg‑AI“ vandamálið, þar sem ósýnileg gagnaöflun getur farið fram úr vitund notenda. Áframhorf sýnir að áhorfendur munu fylgjast með næstu hugbúnaðarútgáfu Apple, um það er talað að hún muni bæta við skyltum hljóðviðvörunum eftir styttri tíma og strangari sannprófun fyrir þriðju aðila aukahluti. Reglugerðarstjórnir í ESB eru einnig að vinna að strangari reglum um „felld rekjanetæki“, sem gætu krafist þess að Apple endurhanna AirTag‑a eða innbyggja sterkari auðkenningu. Hvernig tæknajafnan nær að jafna öryggi notenda við aðdráttarafl óaðfinnanlegs rekjandi ferils mun móta næsta kafla persónulegs staðsetningarpersónuverndar.
41

Apple forðast annan innflutningsbann á endurhannaðum Apple Watch í nýlegum dóm

Mastodon +6 heimildir mastodon
apple
Apple hefur unnið dómstólsákvörðun um frestun sem hindrar annan bandarískan innflutningsbann á nýhönnuðum Apple Watch módelum. Dómarinn, sem gefinn var út af Bandaríkjadalstólinum fyrir alþjóðlegar hringrásir (U.S. Court of Appeals for the Federal Circuit), fellur niður takmarkið sem hefði átt að taka gildi á þeim degi sem fyrirtækið lagði inn áfrýjun, og leyfir því að klukkurnar haldi áfram að koma inn í Bandaríkin á meðan Alþjóðlegur viðskiptastofnun (International Trade Commission – ITC) skoðar málið. Ágreiningurinn byggist á ákvörðun ITC frá 2023 sem bannaði upprunalegu Series 9 og Ultra 2 klukkurnar vegna ásökunar um brot á einkaleyfum Masimo Corp. um pulssúlfúnsæri. Apple svaraði með því að endurhanna skynjara og kynna “Series 10” og “Ultra 3” í ágúst 2025, og hélt því fram að breytingarnar brjóti keðju brotsins á einkaleyfum. ITC setti fram umfjöllunardagsetningu 14. nóvember þar sem spurt var hvort endurhönnunin komi í raun í veg fyrir kröfur Masimo, og setti ákvörðunarmörk til 12. janúar. Frestunardómarinn frá áfrýjunardómstólnum þýðir að endurhönnunin má selja næstu tvo mánuði, sem gefur Apple tíma til að sanna mál sitt. Ákvörðunin er mikilvæg því Apple Watch stendur fyrir um það bil 15 % af heildartekjum Apple í vélbúnaði og er lykilvettvangur fyrir heilsufarsvöktun, samþættingu þjónustu og samkeppni í snjalltækjum. Annar bann myndi krefjast þess að Apple dragi úr birgðum, trufla birgðakeðju og gæti hugsanlega leitt til markaðshlutaáfalls til keppinauta eins og Samsung og Garmin. Hún gefur einnig til kynna hversu áköf bandarísk viðskiptayfirvöld eru í að framfylgja innflutningsbönnunum tengdum einkaleyfum á háþróuð tæki. Hvað á eftir að fylgjast með: Endanleg ákvörðun ITC þann 12. janúar, sem gæti annaðhvort staðfest frestunina og leyft óháða innflutning eða endurheimt bannsins, sem myndi kalla á nýja áfrýjun. Fjárfestar munu fylgjast nánar með fjórðungartölum Apple fyrir Q2 til að sjá hvort söluárangur í klukkuafurðinni haldi áfram að vera sterkur, á meðan iðnaðarskoðendur munu fylgjast með hvort málið setji fordæmi um hönnun eftir lögum til að forðast einkaleyfisbrota í tæknigeiranum.
41

BREYT: bæti við myndsönnun í málinu. # mlibc og # Managarm nota/innihalda # AI / # LLM

Mastodon +6 heimildir mastodon
claude
Grunn C-bókasafn Managarm, mlibc, hefur reynst innihalda kóða sem er framleiddur af stórum tungumálalíkani. Leitin á GitHub eftir „managarm mlibc Claude“ leiddi í ljós commit þar sem frumskapa verkefnisins, Alexander van der Grinten (avdgrinten), og annar þátttakandi settu inn blokk af AI‑skrifaðum kóða beint inn í kerfisákvörðunarlags bókasafnsins. Brotið, sem var sett á opinberu spjallborðinu, inniheldur skjámynd af umdeildum línum og tengil á leitarniðurstöður í geymslunni, sem leiddi til tafarlausrar viðbragða frá Managarm‑samfélaginu. Uppgötvan er mikilvæg af nokkrum ástæðum. Fyrst er mlibc grunnstoð staðlaðra bókasafna fyrir Managarm stýrikerfið, áhugaverð OS sem stefnir að færanleika milli arkitektúra eins og x86‑64, AArch64 og RISC‑V. Að setja inn LLM‑framleiddan kóða í svona lágstigs íhluti vekur spurningar um réttmæti, öryggi og viðhald – vandamál sem eru erfiðari að yfirfara þegar uppruni kóðans er óljós. Í öðru lagi varpar atvikið ljósi vaxandi áreiðanleika AI‑aðstoðarmanna eins og Claude í opnum hugbúnaðarþróun, og endurspeglar áhyggjur sem við settum fram í fjölmiðlaumfjöllun okkar 19. apríl um staðbundna LLM‑umboðsmenn og þörfina á strangri mati á AI‑framleiddum framlögum. Að lokum eru leyfislegar afleiðingar áberandi: AI‑framleiddur texti gæti erfð réttindi frá þjálfunargögnum módelins, sem gæti flækt í sig íhaldandi BSD‑stíls leyfi bókasafnsins
36

Þegar þjónusta veitirðar gefur þér ágætu: Lærdómur frá Anthropic og OAuth-lókalokun

Dev.to +6 heimildir dev.to
anthropic
Anthropics ákvörðun um að afturkalla OAuth-aðgangsleyfi fyrir OpenClaw-vettvanginn þann 4. apríl gerði það að yfir 135.000 þriðja aðila tengingar sem byggðu á fyrirtækið Model Context Protocol (MCP) voru óvirkar í einu brasi. Ákvörðunin, sem var tilkynnt aðeins nokkrar klukkustundir áður en tengingar voru lokaðar, olli því að forritarar voru í miklum vandræðum þar sem vélrænar aðstoðarverkfæri og gögnflutningstól lostu aðgang að Claude-módelum fyrirtækisins. Notendur OpenClaw voru vitni að villumeldingum á yfirdökku, á meðan fjöldi SaaS-salar voru að viðurkenna viðskiptavini sína að tímaðir verkefni myndu mistakast þar til nýir aðgangsleyfir gátu verið gefir út. Lokunin er mikilvæg þar sem hún sýnir uppbyggðar svæðingar í þróandi samfélagi "agentic" AI-þjónustu. MCP var kynnt í lok árs 2024 sem almennt "USB-C" fyrir LLM, með löftum um plug-and-play-tengingar á milli módela og ytri tækja. Einnhliða breyting Anthropics - sem árangursríkt var "rug-pull" árás - sýnir hvernig þjónustuveita getur breytt leyfum eða skipt um tæki skilgreiningu eftir að notendur hafa nú þegar veitt samþykki, aðferð sem er lýst í nýrri ETDI-rannsókn á tæki-squatting og rug-pull árásum. Fyrir fyrirtæki sem hafa bakað LLM-knúin sjálvvirka í mikilvægar vinnuflæði, þýðir slíkar óvæntar afturkallar í starfstíma niður, áhættu á gögnalek (ef illvilligar afleiðingar eru kynntar) og lögfræðileg áhættu yfir brottfalli í þjónustu-samningum. Hvað á að horfa á næst: Anthropic hefur lofað að kynna "grace-tímabil" OAuth-endurnýjunarferli, en tímalínan er enn óskýr. Iðnaðarhópar eru að semja stefnu-bundnar aðgangsstjórnun sem krefur þjónustuveitana um að tilkynna brotthefjandi breytingar með lágmarki 30 daga fyrirvara. Reglufyrirkomar í ESB og Noregi eru væntanlega að skoða hvort slíkar einhliðar lokanir broti gegn þróandi AI-þjónustu-gagnsæi reglum. Forritarar eiga að athuga MCP-tengdir sínar, setja upp afturvarnir aðgangsleiðir og fylgjast með OWASP MCP Öryggis Snara Blaði sem mun koma út um leiðir til að styrkja. Atburðurinn er áminning um að áhætta á því að vera háður einum LLM-veitanda getur orðið einn punktur missæki í AI-fyrirstillingum.
36

Útgáfuvandamál Gemma-4, easyaligner fyrir hljóð og einkamál Claude Enterprise

Dev.to +6 heimildir dev.to
claudedeepmindgemmagooglemultimodalprivacy
Google síðasta opna hugbúnaðarlíkan, Gemma-4, hefur fengið erfitt uppáhald í víðáttum. Fyrra notendur um alla Evrópu segja að lofuðu "framsýnilegu fjölploka hugbúnaði á tæki" hætti á venjulegu búnaði, með minnishluta og tímaáhættu sem eru meiri en líkanið hefur á sínu eigin skjalum. Vandanum virðist tengjast útvíkkri á hljóðargrein líkansins, sem, í ólíkingu við smærri systkini, krefst sérstaks DSP-pípulags sem margir edge-AI pakkar eru án. Fyrir norrænar smáfyrirtæki sem hafa verið að byggja á Gemma-4 til að koma í framleiðslu næstu kynslóðar aðstoðar- og sjón- og talmálsaðila, þá kemur þessi afturhald í verkum að endurskoða útgáfutíma og gæti vakið áhuga á meiri þróaðum valmöguleikum eins og LLaMA-3 eða Anthropic Claude. Á sama tíma hefur opna hugbúnaðarsamfélagið kynnt "easyaligner", léttvæga Python-bókstaf sem samstillir hrátt hljóð með textaskráningum í nær-rauntíma. Byggt á Whisper-encoder og með notkun á dynamískri tíma-krókun, segir tólfið að hafa undir-50 ms samstillingsvillu á 16 kHz talmáli, frammistöðuvæxt sem gæti mildað sumir hljóðasamþættingarvandamál Gemma-4. Fyrra mælingar benda til að það virkar úr kassanum með bæði Whisper og minni Gemma-4 hljóðahöfðum, og bjóðar þróendum pragmatische brú milli þess sem stærri líkanið þroskast. Þriðji þátturinn snýr að einkamáli Claude Enterprise. Eftir að við höfðum ritað um falin telemetri í Claude Desktop og kerfis-spurningar milli útgáfanna 4.6 og 4.7, hafa nýir innra skjöl lekið frá Anthropic, sem sýna að fyrirtækjasviðið heldur áfram að skráa ítarlega notkunargögn - þar á meðal spurningar- og líkani- mynduðu kóðabita - til miðstöðvaranalýsuhúbs. Anthropic segir að gögnin séu ópersónuleg og notuð til að bæta öryggi, en þessi upplýsingar kveikja aftur umræðu um fyrirtækjahugbúnaðar- umsjón, sérstaklega fyrir regluðum geirum á Norðurlöndum. Hvað á að horfa á næst: Google er væntanlega að gefa út lagfært Gemma-4-útgáfu með slimmari hljóðastacki innan vikna; easyaligner-váruhaldari áætlar að bæta við Rust-miðstöðvar til að lækka tímaáhættu enn frekar; og Anthropic hefur lofað sjálfstæðri athugun á Claude Enterprise-gögnun, með niðurstöðum sem á að birtast fyrir enda 3. fjórðings. Samruni líkani-útgáfuvandamála, tólavæðingar og einkamálsvarnar mun móta AI-notkun í svæðinu í mánuðunum sem koma.
35

Evrópusambandið veitir 180 milljónir evra í samning um sjálfstæða skýjaþjónustu til fjögurra veitu

Mastodon +6 heimildir mastodon
Evrópuframkvæmdin hefur undirritað sex ára samning við fjögur evrópsk skýjafélög til að veita „sjálfstæða skýjaþjónustu“ til stofnana, embætta, skrifstofa og aðila ESB. Samningurinn, sem var tilkynntur föstudaginn, markar endi á innkauparferli sem hófst í október 2025 og er þessi áskorun hin stærsta til að draga úr háttsemi á þjónustu veitenda utan Evrópu. Vinnandi félagssamningar eru Post Telecom – sem starfar með CleverCloud og OVHcloud – StackIT, Scaleway og Proximus, sem munu veita þjónustu gegnum sameignarfélag sitt S3NS með Thales og Google Cloud. Saman munu þeir veita grunnvöll sem uppfyllir ESB-reglur um vernd persónuupplýsinga, eigin öryggisstaðla ESB og gildi sem eru í Digital Services Act og framtíðarreglum um gervigögn. Samningurinn er mikilvægur því hann býr til sérstakan, löglega samrýmandi skýjalag fyrir almenningssvæðið, sem verndar viðkvæmar upplýsingar fyrir erlend yfirvöld og mögulegar birgðalásir. Með því að dreifa vinnslum á marga veitendur, hyggst Framkvæmdin auka endistæði, hvatja samkeppni meðal evrópskra tækni-fyrirtækja og leggja grunn að vinnslum sem knýja á gervigögn, eins og generative-AI, MLOps og stórskaða gögnagreiningar. Samningurinn fellur einnig í Digital Europe Programme, sem áætlar milljarða króna í byggingu heimavæddar rafrænnar menningar. Næstu skref munu snúast um útgáfuskipan, samningar um þjónustustig og innleiðingu tækja sem uppfylla framtíðarreglur ESB um gervigögn. Áhugasamar munu fylgjast með því hversu hratt veitendur geta staðfest samræmi, hvort boðið vekur meiri fjárfestingar í evrópskri skýja-getu og hvort módelið vekur aðra almenningssvæðis-kaupendur – frá þjóðarríkisstjórnum til rannsóknarstofnana – til að fylgja þessu dæmi. Samningurinn getur endurtekið evrópska skýjamarkaðinn og sett staðal fyrir rafræna sjálfstæði um allan heim.
35

Nýr bakgrunnsmynd: "River Sunrise" í Daily Wallpaper á iOS og Mac

Mastodon +6 heimildir mastodon
openai
Daily Wallpaper app fyrir iOS og macOS hefur bætt við nýja AI-skapta bakgrunnsmynd sem heitir "River Sunrise" og er nú í boði á App Store (dailywallpaperapp.com/appstore). Myndin, sem sýnir líflega skilringu á fljóti, var búin til með nýjasta útbreidda módel OpenAI og merkt undir verkefnið AForest, sem er samvinnuverkefni sem sameinar rannsóknir í generative-AI með náttúru-tilbrigðum. Útgáfan merkir þriðja AI-kraftaða bakgrunnsmynd sem þjónustan hefur gefið út þessa mánuð, eftir að hafa birt MissKittyArt-röðina sem við höfðum yfirferð í fréttum okkar 4. apríl um generative-AI uppsetningar. Með því að bjóða upp á nýja háupplausnarmynd daglega, breytir Daily Wallpaper síma og skjáborð heimaskjáinn í snúandi myndasafn, sem sleppir stöðnu, royalty-fríu pakka sem hafa ráðið markaðnum í ár. Þessi ákvörðun undirstrikar víðari breytingu: AI-verkfæri eru ekki lengur takmörkuð við atvinnustofur heldur eru eingengnar beint í forrit sem eru ætluð neytendum, sem gefa notendum aðgang að sérsniðnum list sem þarf ekki hönnunarfæri né dýra hugbúnað. Fyrir utan nýjung, vekur útgáfan spurningar um höfundarétt, fjármögnun og val. Líkanir OpenAI leyfa viðskiptavirkni af búnu til myndum, en viðskiptaþróun appins - ókeypis niðurhal með valfrjálsum premium-áskriftum fyrir háupplausnarmyndir - bendir til að prófa neytendavilli til að borga fyrir AI-valda æstétík. Auk þess bendir AForest merkingin til að þetta geti þróað sig í vörumerki sem getur dregið að sér auglýsendur sem leita að náttúru-samræmdum sjónvarpsstað. Hvað á að horfa á næst: Daily Wallpaper áætlar að kynna notendastýrðar fyrirspurnir seinna þessa kvarta, sem leyfa áskrifendur að stjórna AI-stíl í rauntíma. Keppinautar eins og Walli og Artify eru þegar að prófa svipaðar eiginleika, svo næstu mánuðir mun líklega sjá hröðan vöxt í AI-kraftaðum sérsniðnum tólum. Halda augum á því hvernig iOS 18-víðburðir Apple sameina dynamískar bakgrunnsmyndir, sem geta breytt daglegum AI-list frá nýjungu í aðalþátt móðursnjáls.
35

Nýtt framförðun í gervigreind: Að láta neyrðanet hætta að læra á ákveðnum dæmum

Mastodon +6 heimildir mastodon
ethics
Lið af rannsóknarmönnum kynnti SalUn, aðferð sem leyfir neyrðanetum að hætta að læra á ákveðnum þjálfunardæmum með því að breyta aðeins þeim þyngstum þáttum sem hafa mest áhrif. Þetta var kynnt sem ICLR 2024 Spotlight ritgerð, og SalUn greinir "merkilegar" breytur sem tengjast ákveðnum gögnum og uppfærir þær aðeins nógu til að útiloka áhrif dæmunnar án þess að snerta þannig aðra hluta módelins. Á CIFAR-10 prófi náði aðferðin unlearning nákvæmni innan 0,2% bils í mun til endurþjálfunar frá byrjun, niðurstaða sem keppir við reikniaflakostnað einnar æfingar. Þessi frammistig eru mikilvægir þar sem réttur til að vera gleymdur og vaxandi gagnaverndarreglur eru að þvinga stofnanir til að eyða persónulegum upplýsingum úr allt stærri módelum. Hefðbundnar aðferðir - endurþjálfun frá byrjun eða nákvæm þjálfun á eftirstandandi gögnum - eru ódýrlegar fyrir dagana multi-milliarda þáttamódel. Með því að starfa á þáttastigi, lofar SalUn skali og lágkostnaðarleið til að uppfylla kröfur, sem gæti breytt því hvernig fyrirtæki stjórna lífsferli módela og athuga uppruna gagna. Fyrir utan að uppfylla kröfur, snertir rannsóknin djúpar étískar umræður um módelóklæði. Saliency-basiðar skýringar hafa lengi verið gagnrýndar fyrir óstöðugleika; SalUn snýr við því, með því að nota sama viðkvæmni til að staðfesta nákvæmlega þá þætti sem kóða hlut af gögnum. Tvöfaldur notkun á saliency vekur því nýja öryggisspurning: geta óvinir vopnaðir valfrjálsum þáttabreytingum til að draga módel niður ávallt, eins og nýlegar könnun á samvinnuunlearning hafa varað við? Næstu skref munu prófa SalUn á stærri sjón- og tungumálamódelum, og á raunverulegum gögnaleyfisbeitingum undir GDPR-likum rammi. Rannsóknarmenn eru einnig væntanlega að rannsaka varnir sem greina illvilligar unlearning-tilraunir. Ef aðferðin skali, gæti hún orðið hornsteinn í ábyrgri gervigreindarútgáfu, sem sameinar persónuverndartryggingar við vísanleika dagana stóra módela.
35

Íslensk útgáfa iPhone 18 Pro kemur líklega í fjórum litum

Mastodon +6 heimildir mastodon
apple
Apple er að draga saman litapallettu fyrir iPhone 18 Pro sem er í vændum, að því er segir í tilvitnun frá Bloomberg og aðstoðarrapportum frá MacRumors og Instant Digital. Vörulínan er væntanlega að innihalda djúpan vínrauðan, dökkbrúnan, rikan fjólubla og fjórða lit sem líkist nútímalegri útgáfu af gulli, lit sem Apple bjó til síðast á iPhone 16 Pro. Sá rumor-pottur sem hefur verið að safnast síðan í nóvember bendir til þess að nýir litir munu taka sæti þeirra hefðbundnu silfra, grafíta og gullvalkosta sem hafa skilgreint nýrri Pro-útgáfur. Liturákvörðunin er mikilvæg því Apple-vörur í háprísaflokki hafa verið að leggja allt meira stress á sjónræna aðgreiningu til að réttlæta hærri verð og að halda vörukringinni frískri. Takmörkuð en einkennandi litapalletta getur knúið áfram kröfum fyrir fyrstu kaupendur, hvatt til sölum á aukahlutum og styrkt "fashion-tech" stöðu Apple gegn Android-fánamerkjum sem oftast bera upp víðara spektrum af litum. Auk þess bendir valið á dökkari, fæðingarlausi litum til almennar iðnaðarhefðar í átt að undirstaðluðum yfirbragðum, á meðan möguleg endurkoma gull-litsvæðingar bendir til nóstalgískrar vísbendingar til fyrrum vinsælla neytenda. Það sem á að horfa á næst er september 2026 uppfærða atburði, þar sem Apple mun staðfesta endanlega litaval sem hluti af íbúnaðaruppfærslum iPhone 18 Pro - líklega nýr A-þáttur, bættir myndavélarskynjur og endurtekin titani-ramma. Greinendur munu einnig vera ávarpandi hvort Apple tengir nýja litina við umhverfisákvörðun, eins og endurunnin ál og lágvirkt glas, sögu sem hefur vaxið í mikilvægi fyrir evrópska kaupendur. Halda augum á birgðakeðju-lekum í vikunum sem leiða að ræðunni, því þeir bjóða oft upp nákvæma litanöfn og óvænta sérútgáfur.
35

Foringi sjávarþjóðir: Æðisfarið sem hverfur á bak við Tunglið

Mastodon +6 heimildir mastodon
apple
Foringi Æðisfara II, Reid Wiseman, hefur birt stutt myndbönd sem sýnir Jarðina að hverfa á bak við ósléttu horisont Tunglsins á leiðinni yfir fjarsíðuna þann 6. apríl. Myndböndin voru tekin með iPhone 17 Pro Max sínum úr gákkapallinum Orion, og sýnir "Jarðarlag" myndböndin bláa plánetuna að hverfa smám saman, ásamt öfugri "Jarðarupprisu" þegar geimfarinu kemur fram á hinumegin við tunglslíðið. Myndböndin urðu víralega vinsæl á stuttum tíma og bjóða upp á einstaka sjónarhorn sem aðeins fáir geimfarar hafa nokkru sinni séð. Myndin er meira en augnablik í fjölmiðlum. Æðisfarið II merkir fyrsta mannaða ferðina til Tunglsins síðan Apollo 17, og ferðin yfir fjarsíðuna veitir gagnleg gögn fyrir siglingar, samskipti og landingu Æðisfara III. Með því að skrá Jarðar-Tungl-geometríuna í rauntíma, hjálpar myndbandið Wiseman verkfræðingum að staðfesta brautamódel og bæta tímaeldingu á eldsum á geimfarinu. Viðbragð almenningar undirstrykja einnig markaðsverði ferðarinnar: lifandi, persónuleg myndir geta haldið pólitísku og fjárhagslegu stuðningi við Æðisæðiáætlunina um allt Evrópu og Norðurlöndin, þar sem fjárfestingar í geimtækni eru að vaxa. Áfram í tímann, verða næstu áfanga áhugamannafararins þéttar. Æðisfarið II mun ljúka tíu daga ferð um Tunglið og enda með því að lenda í sjónum síðar þessa mánaðar, eftir því sem NASA áætlar að gefa út aukið myndband úr borði, þar á meðal sólmyrkvi sem sáist frá Tunglslaugi. Gögnin verða að fæða vélrænum greiningartólum sem bæta myndupplausn og draga úr vísindalegum mælingum, þróun sem getur hraðað skipulagningu fyrir sögulegu yfirborðslandingunni á Æðisföri III árið 2027. Á meðan ferðin stendur, munu greinendur fylgjast með því hvernig myndmálið áhrifar almannamál og fjármögnunarákvörðanir fyrir víðari Tunglför áætlunina.
35

Breytingabútur iOS 26.4.2 fyrir iPhone á vægu

Mastodon +6 heimildir mastodon
apple
Apple er að prófa iOS 26.4.2 innanfirmt, og vonast er til þess að byggingin muni berast iPhone-notendum innan vikna, samkvæmt gögnum um heimsóknir sem 9to5Mac hefur greint frá. Nýja punktabútinguna fylgir 26.4.1 útgáfan sem kom út 19. apríl og virkjaði sjálfkrafa öryggisörgjörva sem er sérstaklega hugsaður til að vernda einkalífið á öllum tækjum. Fyrstu vísbendingarnar benda til þess að 26.4.2 muni leysa svart-hvít tilkynningavillu sem kom upp eftir 26.4.1, auk þess sem hún muni leysa úr stöðugleikavandamál sem þróunarfræðingar hafa greint frá á GitKraken og öðrum verkfæri. Tíminn er mikilvægur þar sem punktaútgáfur Apple hafa orðið að raunverulegu leið fyrir hröð bugafíkleiðir og smáætingar á vélrænni þróun. iOS 26 kynnti safn af möguleikum fyrir stórar tungumálamódel (LLM) á tækjunum sjálfum, og 26.4 þátturinn hefur þegar séð endurbætur á talmálfurðum og forspárgreinum. Með því að koma 26.4.2 út fljótt, sýnir Apple að það er að endurskoða þessi eiginleika ásamt því að styrkja öryggi fyrir iOS 27 útgáfuna sem var kynnt á WWDC 2026. Fyrir norrænar fyrirtæki sem eru háð iPhone-öryggi og vélrænni þróun, gæti bútingin endurheimt fullri virkni í mikilvægum forritum sem hættu að virka eftir 26.4.1. Það sem má bíða eftir er opinbera fréttabréf þegar Apple opnar opinbera prófunarútgáfuna. Greinendur munu leita að neinum tilvísunum í nýjar LLM-tengdar API, útvíkkar einkalífsstjórnunar eða samhæfingartilpasningar fyrir nýjasta iPadOS 26.5 og macOS 15 útgáfur. Þróunarfræðingar ættu einnig að fylgjast með App Store Connect-vefsvæðinu til að athuga hvort einhver skyldur SDK-uppfærsla fylgi útgáfunni. Ef útgáfan fer fram án vandræða, mun Apple líklega nota áganginn til að kynna víðari vélræna þróunaráætlun sína áður en iOS 27 kemur út seinna árs.
35

Stór tungumálalíkön og gerandi gervigreind, ó minn! | Framfarir í fornleifafræðilegri framkvæmd | Cambridge Core

Mastodon +6 heimildir mastodon
Nýja ritgerðin hjá Peter Cobb, “Stór tungumálalíkön og gerandi gervigreind, ó minn!”, birtist í Cambridge Core – Advances in Archaeological Practice, bindi 11, sérstök útgáfa 3, og kortleggur hraða innrás verkfæra eins og ChatGPT, Midjourney og nýrra fjölbreyttra módelanna í fornleifafræðilega rannsókn. Cobb heldur því fram að gerandi gervigreind sé þegar að umbreyta skjölun sviðsvinnu, flokkun fornleifa og gerð grafförslu skýrslna, á sama tíma og hún varpar ljósi á fjölda siðferðilegra vandamála sem fræðin hafa enn ekki leyst. Greinin skráir hagnýtar tilraunir: LLM‑stýrða afritun epigrafískra safna, mynd‑í‑texta pípur sem leggja til gerðaflokkun fyrir keramikabrot, og sjálfvirkt frásagnagerð sem getur breytt hráum sviðsgreinum í birtingarhæft orðalag innan mínútna. Aðstoðarmenn vísa í hraðahraða, lægri hindranir fyrir fræðimenn í ófullnægjandi fjármögnuðum stofnunum og möguleikann á að sameina ólíkar gagnasöfn um heiminn. Gagnrýnendur varða hins vegar að svarta kassa módel geta endurtekist fordóma í þjálfunargögnum, dularfulla uppruna og hvetja til „plug‑and‑play“ hugsunarháttar sem dregur frá sér mikilvæga gagnrýna túlkun. Cobb leggur áherslu á að fornleifaarfleifð – oft tengd frumbyggjum og umdeildum sögum – krefjist gagnsæis í rekstri uppruna og samþykktarferla sem núverandi AI‑vettvangar sjaldan bjóða upp á. Af hverju er þetta mikilvægt núna? Tvöfalt. Fyrst þýðir umfangi LLM‑a að jafnvel sértæk svið eins og fornleifafræði geti nýtt sér gríðarleg tungumála‑ og myndgagnasöfn án þess að byggja sérsniðin módel. Í öðru lagi er strangur aðferðafræðilegur grundvöllur fræðanna prófunarpúntur fyrir hvernig mannúðarvísindasvið geta tekið upp AI á ábyrgan hátt, þar sem hraði er jafnvægið við umönnun menningarminninga. Áframhaldandi þróun krefst þess að samfélagið fylgist með útbreiðslu sérsniðinna LLM‑a þjálfaðra á völdum fornleifasöfnum, myndun siðferðilegra leiðbeininga frá stofnunum eins og European Association of Archaeologists, og væntanlegum vinnustöðum á International Congress of Archaeological Sciences sem munu meta AI‑styrkt vinnuferla. Næsta umferð fjármögnunar frá Horizon Europe í EU mun líklega leggja áherslu á verkefni sem sameina gerandi gervigreind og varðveislu arfleifðar, og setja þannig stefnu fyrir hvernig sviðið takast á við þessa tæknilegu krossgötu.
33

Eftirlit með Anthropic Mythos vegna bankahættu

HN +6 heimildir hn
anthropic
Eftirlitsmenn eru að þröngva umsýslu á nýjasta stórmálslíkanum frá Anthropic, Mythos, eftir að bankar á báða síðum Atlantshafsins hófu að nota hann til að leita að falnu netárásum. Alþjóðlegi fjármálastöðugleikarnefnd (FSB) tilkynnti að hún myndi fara yfir kerfisáhrif líkansins og lofa að deila niðurstöðum sínum með seðlabönkum og eftirlitsstofnunum um allan heim. Ákvörðunin fylgir bylgju af prójektum á Wall Street þar sem stórar stofnanir segja að Mythos hafi þegar uppgötvað þúsundir óvæntanir áráða í eldri bankakerfum. Þessi hærri athygli endurspeglar vaxandi ótta um að sama geta sem knýr ógnarvarnir í Mythos geti einnig verið notuð af illvilligum aðilum. Þýskir bankaeftirlitsmenn hafa varað við að djúp kóða greiningarföll líkansins opi í byggingu svæði í eldri kerfum; meðan aðrir yfirmaður í Seðlabanka Englands hafa opnað formlega rannsókn á því hvort Mythos geti óstöðvað fjármálamarkaðskerfið. Yfirmaður áætlunarráðs Goldman Sachs, talaði í einkaeign, lýsti líkaninu sem "yfirbragðþroska" af kerfisáhættu og hvatti til varkár útgáfu. Það sem gerir máli núna er tvíþætt. Fyrst, er bankageirið mest regluð og tengd hluti af heimsefnahag; brot sem er margfaldinn af vélrænni getu sem getur uppgötvað falin galla getur dreifst um markaði. Annar, bendir eftirlitsviðbragð til þess að fara frá tilfellu áætlunarráðstafanir til samræmdra, landamæra yfir eftirlitssamstarf fyrir framtaks AI, sem endurtekur áður komnar áhyggjur sem voru tilgreindar í skýrslum okkar 19. apríl um áhyggjur fjármálaráðherra yfir Mythos. Hvað á að horfa á næstu viku: Áætlunarskýrsla FSB, sem er væntanleg í næstu vikum, mun líklega mynda leiðbeiningar um AI knúnar varnir. Á sama tíma gæti rannsókn Seðlabanka Englands knúið til skyldu til að afhjúpa AI aðstoðaða áráða skoðun. Að lokum munu iðnaðarathugunum fylgja því hvort bankar stækka Mythos úr prójektum eða draga sig til baka til að nota meiri stjórnandi, óljósari tól. Úrslit mun setja fordæmi fyrir hvernig fjármálaveraldur jafnar AI knúnar öryggi gegn ógnarhrifum nýrra kerfisáhættu.
32

Nýja símulatiónartækni MTA mun þjálfa nýja strætóvagna stjóra á skömmum tíma

Mastodon +6 heimildir mastodon
googleopenai
Flutningsmálaráðið hefur falið til gerðar símulatiónartæki fyrir strætóvagnastjóra á verði upp á 1,4 milljónir dollara, sem mun notast við gervigreind og mun á skömmum tíma taka við af flestum vagnaprófum á vögum fyrir nýja starfsmenn. Tækið er sett upp á þjálfunarmiðstöðinni í Zerega í Bronx og myndar raunverulegar aðstæður um umferð, veður og farþegaafl, á fullskalavíruðri eintaki af götum Manhattan. Þar geta þjálfendur æft sér að breyta eða stöðva strætóvagninn, að hlýða við stöðvar og að bjarga strætóvagninu án þess að setja farþega eða strætóvagnabúnað í hættu. Ákvörðunin kemur á tímum þegar því er vant í strætóvagnastjórum og eftir röð af ósæturhlutum sem hafa sett þrýsting á Flutningsmálaráðið til að nýja starfsmannaaðferðir. Með því að kenna nýjum starfsmönnum í stjórn á strætóvagni í stjórnðu gervigreindumhverfi, vonast til að málið geti skorðað niður tímann til að fá vottorð um 30% og draga úr slysum með nýjum strætóvagnastjórum, að sögn embættismanna. Gervigreindarkerfi símulatínsins, byggt á módelum frá OpenAI og Google AI, myndar breytilegar umferðarmynstur sem aðlaga sig að ákvörðunum strætóvagnastjórans, og bjóða upp á breytileika sem stöðugar myndbandsnámskeið geta ekki mælt við. Sérfræðingar á sviði flutninga taka fram að tæknið líkist þeirri sem flugfélög hafa notað í áratugi og sem fyrirtæki sem eru að þróa sjálfrænar farartæki eru að prófa í dag. Ef reyndin sýnist vel heppnuð, áttar Flutningsmálaráðið til að nota kerfið á önnur þjálfunarsvæði og að tengja rauntímaþjónustugögn við, sem munum leyfa þjálfendum að æfa sér að bregðast við truflanir, eins og vegavinnu eða veðurfar. Ráðið hefur einnig vísað til framtíðar "tölvutvípunkt" af strætóvagnaneti, þar sem gervigreind geti líkst strætóvagnabúnað undir mismunandi stefnumálum. Vakið er eftir fyrsta hópi útskrifaðra strætóvagnastjóra sem hafa lokið námi í símulatíni á þessu ári, og eftir skýrslu Flutningsmálaráðsins um framkvæmdina, sem á að birtast á byrjun árs 2027, sem mun ræða frá þeim kostnaðarbjörgunum, öryggisáhrifum og því hvort aðrar flutningsstjórnir munu taka upp svipaða gervigreindastýrða kennslukerfi.
32

Árásarflötan er veldisvaxandi

Mastodon +6 heimildir mastodon
agents
**Samantekt** Ný skýrsla sem kom út í þessari viku frá öryggisgreini Chris Hughes varar við því að hratt vaxandi fjöldi opinberlega aðgengilegra kóða skapar „árásarmiða‑exponential“ sem engin stofnun er í stakk búnin til að verja. Skýrsla með titlinum *Code Surge: GitHub’s Exponential Growth and the Attack Surface Nobody Is Ready For* sýnir tíu sinnum aukningu í fjölda geymslu (repository) á GitHub síðan 2022, aukningu sem er knúin áfram af AI‑studdum kóðagjafa og lýðræðislegri aðgengi að hugbúnaðarverkfærum. Rannsóknin heldur því fram að hver lína sjálfvirkt framleidds kóða, hver API í örþjónustu og hver IoT‑fastbúnaðaruppfærsla bætir við nýtt innrásarpunkt fyrir ógnarmenn. Hughes vísar til „Vulnpocalypse“ – hugtaksins sem lýsir óumflýjanlegri bylgju viðkvæminda sem mun koma fram þegar AI‑aðilar framleiða kóða hraðar en öryggisteymir ná að yfirfara hann. Skýrsla tilvísar í nýleg atvik, eins og skaðlegan falska Claude‑vef, og ádeilu um forystu OpenAI, sem fyrri merki um að árásarmenn nýti nú þegar vaxandi kóðagrunn. Af hverju þetta er mikilvægt núna er einfalt: hefðbundin varnarmörk missa viðeigandi mikilvægi í heimi þar sem sjálft mörkin eru að fjölga sér um skývirkni, íláttar þjónustu í íláttar umhverfi (containers) og milljarða tengdra tækja. Greinir í greiningu á LinkedIn áréttar að ef fyrirtæki hafa ekki farið yfir í algerlega sjálfvirka, API‑fyrsta árásarmiðastýringu (ASM) fyrir lok árs 2026, munu þau standa frammi fyrir óeðlilegum áhættu á brotum. Utanaðkomandi árásarmiða‑eftirlitskerfi eru sett fram sem nauðsynleg til „perimeter‑less“ ógnagreiningar, á meðan API‑öryggisrammar reyna að halda í við fjölda endapunkta. Það sem þarf að fylgjast með eru þrjár samræðandi þróanir. Fyrst, væntanlegt er að birgjar sjálfvirkra ASM‑verkfæra tilkynni um AI‑studdar greiningarhæfni innan nokkurra mánaða. Í öðru lagi, reglugerðarstofnanir í ESB og norrænum ríkjum eru að vinna að leiðbeiningum sem gætu krafist stöðugrar útsetningarmælingar fyrir lykilinnviði. Í þriðja lagi er áætlað að bylgja af háprofílsárásum á AI‑framleiddar bókasöfn muni prófa viðbúnað greiningarinnar áður en árið er lokið. Fyrirtæki sem innleiða stöðugar kóðayfirferðarpípur og fjárfesta í rauntíma yfirferð á yfirborðinu verða þau sem halda sér á undan ógninni um „Vulnpocalypse“.
32

Skemmtilegt að sjá fólk vinda sig í pretzelar til að sjá framtíðar siðferðilega notkun # llm

Mastodon +6 heimildir mastodon
Framkvæmdalistaverk á Norðurlanda AI‑siðferðisþingi í Helsingborgi í síðustu viku vakti athygli og breytti áætlunum. Á umræðu um „Ábyrga innleiðingu stórra tungumálalíkana“ vinda nokkrir framleiðendur og boðnir virkjuðir sig í pretzel‑líkön form á meðan þeir ræddu hvernig LLM‑ir gætu verið notaðir siðferðilega. Myndræna gríninn, sem var streymdur í beinni og merktur með hashtaginu #LLM, átti að dramatísera „vöðlun“ stefnu, rannsókna og markaðsaflanna sem þarf til að halda öflugum tungumálalíkönum í skekkju. Styrtið varð fljótt áreiti á samfélagsmiðlum. Gagnrýnendur héldu að sýningin felji dýpri vandamál: án þess að takast á við hagnaðarmiðaða rökstuðning kapítalísma, verður hver siðferðileg ramma um LLM‑ir yfirborðsleg. Einn umfjöllunarmaður skrifaði: „Fólk vinda sig í pretzelar til að sjá framtíðar siðferðilega notkun LLM, gleymandi að það er engin siðferðileg neysla undir kapítalismi.“ Ályktunin hljómaði um alla Norðurlanda tæknasamfélög, vakti upp eldri umræða sem hefur verið á bak við nýlegar greinar um AI‑stjórnun í svæðinu. Af hverju þessi uppreisn skiptir máli er tvíþætt. Fyrst sýnir hún vaxandi sundurliðun milli tæknifræðinga sem kjósa smámála öryggisráðstafanir — eins og matvæla‑stýrðar pípur lýst í nýlegum greinum okkar um staðbundna LLM‑umhverfis­þjónustur — og virkjuða sem krefjast kerfisbreytinga á efnahagslegum byggingum sem fjármagna og græða á AI. Í öðru lagi neyðir þetta vírusaðferð stjórnmálamenn til að takast á við almenningsviðhorf: Siðferðilegt AI er ekki lengur sér
32

vitrupo (@vitrupo) á X

Mastodon +6 heimildir mastodon
Max Levchin, meðstofnandi PayPal og fjármála‑tæknifyrirtæknir, kveikti nýja umræða á X þegar hann lýsti daglegum hugbúnaðarfyrirtækjum sem „hugbúnaðar­skúlpturum“ frekar en hefðbundnum forritara. Í endurútgáfu sem AI‑umfjárhagsmaðurinn vitrupo deildi, hélt Levchin því fram að tilkomu stórra tungumálalíkana (LLM) hafi breytt hlutverki verkfræðings frá því að slá inn kóða handvirkt til þess að stýra samtals‑tólum sem framleiða, betrumbæta og villuleita hugbúnað eftir þörfum. Athugun hans kemur á lykilpunkti í greininni. Verkfæri eins og GitHub Copilot, OpenAI‑ChatGPT og Anthropic‑Claude framleiða núna virk brot, heilar aðgerðir eða jafnvel smáþjónustur eftir nokkurum náttúrulegum tungumáls‑fyrirspurnum. Fyrirtæki skrá um allt að 30 % aukna framleiðni, og áhættufjárfestar hella í nýsköpunarfyrirtæki sem innleiða LLM beint í þróunarpípur. En Levchin bendir á að mannlegur þáttur – bragð, arkitektúr‑dómkröfur og siðferðileg sýn – geti ekki verið fullkomlega sjálfvirkur. Verkfræðingar þurfa að læra að skilgreina vandamál, gagnrýna úttak líkana og bæta við sértækum smáatriðum – færni sem verður sífellt meira metin en bara kunnátta í að skrifa kóða. Það sem á eftir að fylgjast með er tilkomu nýs atvinnugreina. „Prompt engineering“ og „model‑centric“ hönnun birtast nú þegar í atvinnuauglýsingum, á meðan helstu IDE‑framleiðendur setja upp samþættar spjallviðmót og rauntíma kóða‑skoðunarbota. Háskólar endurskoða námskrár til að blanda saman hugbúnaðargrunni með færni í að búa til fyrirmæli og túlkun líkana. Á sama tíma glíma fyrirtæki við stjórnun – hvernig á að endurskoða AI‑framleiddan kóða til að finna öryggisbrot, leyfisbroti og hlutdrægni. Ef kenning Levchins um „hugbúnaðar­skúlptur“ reynist rétt, mun næsta bylgja framleiðni byggjast á því hversu fljótt forritarar geta mestir í samtali við LLM án þess að missa mikilvæga mannlega dómgreind sem heldur hugbúnaðinn áreiðanlegum, öruggan og í samræmi við viðskiptamarkmið. Jafnvægið milli sjálfvirkni og eftirlits mun móta framtíð hugbúnaðarverkfræði um allt norræna svæðið og víðar.
32

Mal (@unbankedgroup) á X

Mastodon +6 heimildir mastodon
agentsclaude
Mal, þróunarmaðurinn á bak við Unbanked AI verkfærasamfélagið, birti stuttan þróunartipp á X sem hefur þegar náð til Claude‑byggenda umhverfis. Í tístinu útskýrir hann að “verkfærasnið” skrá – oft nefnd CLAUDE.md – þjónar sama tilgangi og kerfisáreynsla, og að þróunaraðilar ná betri niðurstöðum með því að skrifa skýra, verkefna‑miðaða lýsingu fyrir umhverfið í stað þess að breyta kerfisáreynslunni í lotum. Ráðleggingin, merkt með #promptengineering, #aiagents, #tooling og #llm, undirstrikar vaxandi samstöðu um að skýrar, uppbyggðar leiðbeiningar skili meiri árangri en tilraun‑og‑villa aðferðin sem ríkti í upphafi LLM‑tilrauna. Tippið kemur í kjölfar þess að kínverskir tæknifyrirtæki Alibaba, Baidu og Tencent hafa hver um sig sett á laggirnar fyrirtækjavædd AI umhverfisvettvangur í sömu viku, þar sem Alibaba tilkynnir 20 milljón fyrirtækjanotenda í DingTalk‑útgáfunni. Þessir útgáfur sýna markaðsbreytingu: fyrirtæki fara frá almennum spjallmenum yfir í sérhannað umhverfi sem framkvæmir skilgreind vinnuflæði. Með því að hvetja til notkunar á verkfærasniðskrám, hvetur Mal þróunarsamfélagið til meira skipulags í verkfræði sem getur vaxið í slíkar stórar innleiðingar. Af hverju þetta skiptir máli er tvíþætt. Fyrst og fremst minnkar skýrari verkefnalýsing “prompt‑þreytu” sem dregur úr þróunartímaröðum og getur leitt til falinna hlutdrægna eða öryggisbrests – vandamál sem nýlega komu í ljós í Claude‑tengdum skaðlegum hugbúnaði. Í öðru lagi opnar staðlað lýsingarsnið leiðina fyrir samhæfða handtökusamskiptareglur, hugmynd sem Mal hefur áður sýnt með uppbyggðu “handoff” skema sem gerir mörgum umhverfum kleift að skila verkum á milli án truflana. Áframhaldandi þróun mun fylgjast með svari Anthropic: hvort þau muni formleggjast CLAUDE.md‑stíls skrár í SDK eða verkfærasafninu sínu. Á sama tíma gæti samkeppnisþrýstingur frá Alibaba, Baidu og Tencent flýtt við innleiðingu slíkra staðla í breiðara LLM‑vistkerfið, og móta hvernig fyrirtæki byggja áreiðanleg, viðhaldsvæn AI umhverfi.
30

Frá Núlli til AI Aðgerðasæta: 6 Mánaða Ferðalag í Prófun og Villu

Dev.to +6 heimildir dev.to
agents
Þróandi sem hefur verið að tilraunir með stórum tungumálamódelum í hálf ár gefur út opinn „AgentZero“ ramman á GitHub, og tilkynnar endi á sex mánaða ferðalagi í prófun og villu í opinská blogg færslu sem heitir „Frá Núlli til AI Aðgerðasæta“. Færslan fer í gegnum mistök sem plágðu fyrstu prótótýpa - mistækkaðar tolla leyfi, óvissir samhengi gluggar og dýrar skýjaeinangrunar - og praktískar lausnir sem loksins gáfu locally keyrandi aðgerðasæta sem getur flakið, kóðað og sjálfvirkði venjulegar verkefni án þess að afhjúpa AWS aðgangslykil. AgentZero áður en áður í sér „local-first“ hönnun, sem endurtekur fjölmargir aðgerðasæta yfirlit sem við höfumum rætt áður þessa mánuði, og sjálfsnæmingu BaaS lag sem leyfir nýjum aðgerðasætum að skrá eigin verkfæri og leyfi. Með því að búnta léttu samhengisverkþátt, leyfir ramman þróendum að móta „hugann“ aðgerðasætis með fyrirspurnartilvikum og minningarmáta, hugtaki sem við ræddum í grein okkar 20. apríl um samhengisverkþátt fyrir aðgerðarkerfi. Geymslan gefur einnig út með vísvísa sem áður en áður „forbidden“ villur sem margir nýir notendur þjást þegar aðgerðasæti reynir að kalla ytri API án réttar aðgangslykla. Hvers vegna þetta máli er tvíþætt. Fyrst, látið losa ramman þröskuld fyrir áhugamenn og smærri fyrirtæki til að tilraunir með sjálfbærir aðgerðasæti án þess að gefa upp stjórn í skýjaaðilum, og styrkir breytinguna til einkamálaréttar, á staðnum, AI. Annar, opinn skjölun á göllum bjóðar upp á sjaldgæfa námsefni sem getur hraðað almennt kerfið frá sýningu á prófun til vinnsluþæfta þjónustu. Hvað á að horfa á næst er samfélagið svarar á GitHub - vandamál, pull beiðnir og viðbótarsamningar sem geta útvíðað AgentZero verkfæri. Við munum einnig halda auga með því hvort ramman er tekin upp í framtíðarútgáfum af local-first yfirliti og hvort fyrirtæki vísa til þess sem öruggri afleiðu fyrir aðgangslykiloríku skýjaaðgerðasæti. Næstu vikur ætti að sýna hvort AgentZero verður hornsteinn í uppskáldandi sjálfs-hýsingar aðgerðasæta.
30

Skugg‑AI vandamálið: Af hverju er notkun LLM‑anna í fyrirtækinu þínu stærri en þú heldur

Dev.to +5 heimildir dev.to
Ný, iðnaðarvíð rannsókn sem gefin var út í þessari viku sýnir að „Skugg‑AI“ – óheimil notkun stórræða tungumálalíkana (LLM) af starfsmönnum – er langt útbreiddari en flestir öryggisteymi gera sér grein fyrir. Rannsakendur mældu bilið milli opinberlega samþykktra AI‑verkfæra og þeirra falinna, starfsmannastýrðu vinnuflæða sem leysa trúnaðargögn inn í opinbera spjallmenni eins og ChatGPT, Claude og Gemini. Rannsóknin fann að um across sectors, algengustu gagnategundirnar sem líða inn í þessi þjónustukerfi eru viðskiptasamskipti, innri trúnaðargögn, frumkóði, fjármálaskrár og, í reglugerðarumhverfum, vernduð heilbrigðisupplýsingar. Niðurstöðurnar eru mikilvægar því hvert copy‑and‑paste er bein brot á stefnu fyrirtækja um gagnastjórnun og, í mörgum lögsögu, brot á persónuverndarreglum eins og GDPR og EU AI Act. Þegar trúnaðargögn lenda á ytri netþjónum missa stofnanir sýn, verða fyrir áhættu vegna módel‑innspýtingarárása og verða fyrir íbúðarstuld. Skýrsla sýnir einnig að fyrirtæki sem opinberlega hvetja til tilrauna og bjóða upp á prófaða, innri LLM‑vettvang er minna við Skugg‑AI – ekki vegna þess að starfsmenn nota AI minna, heldur vegna þess að starfsemi þeirra er sýnileg og stjórnað. Það sem á eftir að fylgjast með eru nýir stjórnunartiltök. Nokkrir birgjar eru að koma á “AI observability” lausnum sem fylgjast með úttakstraffum fyrir LLM‑spurningar, á meðan Evrópusambandið er að undirbúa skyltar áhættumatsskilgreiningar um AI fyrir stórfyrirtæki. Á Norðurlöndum mun komandi AI‑Governance Forum í Kaupmannahöfn innihalda umráð um að innleiða skugg‑AI greiningu í núverandi öryggisrekstur. Við búumst við strangari fyrirtækjastefnu, öflugri innri módeltilboðum og fjöruðri fjölda samræmisúttektar til að draga úr leynilegri notkun á generative‑AI áður en hún skemmir þau gögn sem fyrirtæki byggja á.
26

Mark Gadala‑Maria (@markgadala) á X

Mastodon +6 heimildir mastodon
anthropicclaude
Claude Design, hönnunarpakki Anthropic fyrir generative‑AI, er þegar að breyta skapandi vinnuferlum aðeins tvö dagar eftir opinbera kynningu. Í X‑færslu þann 20. apríl bentir AI‑útskýrandi Mark Gadala‑Maria á tíu áberandi notkunartilvik sem hafa komið fram innan 48 klukkustunda, frá hreyfimyndum fyrir samfélagsmiðla til hratt tilbúnar vörumerkjaskissur. Hann heldur því fram að hraði og notkunarvænleiki tólsins sé að flýta útbreiðslu AI‑drifinna hönnunar í bæði stofnanir og innanhúss teymi. Uppörvunin fylgir upphafinu 18. apríl, þar sem Claude Opus 4.7 var settur í samhengi við hönnunarsértækar fyrirmæli og sjónrænan ritil. Fyrsta notendur lofuðu getu kerfisins til að búa til útlitsbreytingar, litapalletti og hreyfigrafík úr hreinum texta, og skera niður endurtekningarhringir frá klukkustundum í mínútur. Skrá Dæma Gadala‑Maria sýnir hvernig vettvangurinn fer frá óhreyfanlegum skissum til fullkominna hreyfimynda, geta sem áður kröfðist sérfræðihugbúnaðar og hæfileikaríkra hreyfimyndahönnuða. Af hverju þetta skiptir máli er tvíþætt. Fyrst, hratt ítaka gefur til kynna breytileikapunkt fyrir gener
26

Lloyd býr til á X

Mastodon +6 heimildir mastodon
midjourney
Lloyd Creates, sjónlistamaður með vaxandi fylgjendahóp á X, birti áberandi dæmi um generatív gervigreind í tískuhönnun: hann nýtti QuiverAI til að endurmynda þekktan íhlut sem LEGO‑stílslegt lágmarkapóstur. Umbreytingin, sem var deilt 20. apríl, sýnir getu AI‑líkanisins til að endurhugsa flókin vörumyndir í einfaldar, blokkabundnar myndir á meðan viðurkenning vörumerkisins er varðveitt. Vinnuferlið hjá Lloyd fól í sér að setja inn háupplausnarmynd af skónum í QuiverAI‑„stílsendingarferli“, velja LEGO‑innblásið litaspjald og biðja kerfið um að framleiða flatan veggspjald sem hentar bæði stafrænum markaðssetningum og vörum í takmarkaðri útgáfu. Sýningin er mikilvæg því hún bendir til þess að þróunin frá AI‑framleiddri skemmtilegu list til hagnýtra, merkjavæddra forrita sé á gangi. Hönnuðir geta nú framkallað fjölda sjónrænna hugmynda á nokkrum mínútum, sem minnkar endurtekningarfasa sem áður kröfðist vikna af teikningum og gerð. Fyrirtæki sem framleiða og selja íhluti geta með því að framleiða strax aðlögunarhæfar, auglitisvert efni opnað nýjar leiðir fyrir árstíðabundnar herferðir, pop‑up verslanir og fyrirlestur á samfélagsmiðlum án þess að ráða ytri stúdíó. Auk þess nýtir LEGO‑útlitið nostalgíska sjónræna tungu sem talar til yngri neytenda, og sýnir að gervigreind geti hjálpað vörumerkjum að grípa menningarstrauma hraðar en nokkru sinni fyrr. Það sem á eftir að fylgjast með er hversu fljótt önnur fatnaðarfyrirtæki taka í notkun svipaða ferla. QuiverAI hefur bent á komandi eiginleika eins og 3‑D módelagerð og rauntíma AR forsýningar, sem gætu tengst beint við vefverslunarpalla. Greinir í greininni munu einnig fylgjast með lagalegri umræðu um AI‑afleiddar hönnunir, sérstaklega varðandi vörumerkjandi silhuettir. Ef tæknin skalar, gæti komið til fjöls flóða af AI‑smíðaðum útlitsbókum, prentunum í takmarkaðri útgáfu og jafnvel samstarfsröðum þar sem AI‑ið sjálft er nefnt sem samhönnuður. Næstu nokkrir mánuðir gætu því ákveðið hvort generatív gervigreind fer frá tilraunakenndri sýningu yfir í ómissandi í verkfærakistu fatnaðarhönnunar.
26

Glaze-verkefnið (þ.m.t. Glaze, Nightshade, WebGlaze og önnur

Mastodon +6 heimildir mastodon
University of Chicago’s Glaze Project tilkynnti á þriðjudaginn um mikilvæga uppfærslu á vopnabúnaðarsafninu sínu gegn skrapun, með útgáfu Glaze 2.0, Nightshade 1.5 og opinberu beta-útgáfu WebGlaze. Þrjú atriðin vinna saman til að gera verk listamanna ósýnileg fyrir generative‑AI módel, á meðan þau eru óbreytt í auga mannanna. Glaze 2.0 fínstillir upprunalega reiknirit sem reiknar út minnstu píxel‑stigs truflanir sem þarf til að „rugla“ eiginleikasafn módelins; Nightshade 1.5 bætir við nýjum „eitur‑mynd“ ham sem viljandi breytir innri framsetningu AI, og breytir ávöxtabolli í kaleidoskop af naglahúðarbörum fyrir módelið. WebGlaze býður upp á vafra‑byggða viðmót, sem gerir listamönnum kleift að beita verndinni án þess að þurfa dýrt GPU. Útgáfan kemur í kjölfar aukinnar andstöðu í listasamfélaginu gegn óheimiluðum AI þjálfun. Hárprofíls málsóknir gegn Stability AI og Midjourney hafa varpað ljósi á lagalega gráu svæðið í kringum gagna‑skrapun, og margir sköpunarmenn óttast að þegar mynd er skráð í leitarvél, geti hún verið endurnýtt í óendanlegan tíma. Með því að innbyggja varnarlag í sjálft upprunalega efnið, stefnir Glaze-verkefnið að því að endurheimta valdahækkun til einstakra listamanna og neyða AI‑þróunaraðila til að leita eftir skýrum leyfum. Hópurinn opinberaði einnig að öryggisgrein frá Zürich rannsakendum, birt í júní 2025, hafði leitt í ljós aðferð til að endurhanna upprunalega Glaze, sem leiddi til núverandi harðvörunarátaks. Það sem á eftir að fylgjast með eru þrjár hliðar. Fyrst, munu notkunartíðni meðal sjónlistasamtaka sýna hvort verkfærin geti vaxið út fyrir frumuppsetningar‑labratoríur. Í öðru lagi, geta viðbrögð frá helstu AI‑veitendum—sérstaklega OpenAI, sem nýlega kynnti „GPT Rosaline“ fyrir líffræðirannsóknir—mótað framtíðarleyfisviðræður. Að lokum, eru stjórnvaldsstofnanir í ESB og Bandaríkjunum að móta reglur um gagnsæi í AI‑þjálfun; opinn hugbúnaðarlegur aðferð Glaze-verkefnisins gæti orðið viðmið fyrir samræmi. Ef uppfærslurnar standast nýlegar árásir, gætu þær orðið de‑facto staðallinn í verndun skapandi verka á tímum generative AI.
24

Staðbundið fjölþjónustu mælaborð fyrir Codex CLI og Claude Code

Dev.to +6 heimildir dev.to
agentsclaudecopilotopenai
Nýtt opið kóða mælaborð býður forriturum upp á að keyra Codex CLI og Claude Code hlið við hlið á eigin tölvum, og umbreyta tveimur gervigreindar‑kóðunarumhverfisþjónum í samstillta, staðbundna vinnuflæði. “Local‑First Multi‑Agent Dashboard” sameinar Svelte‑byggt skjáborðsvinnusnið með léttvægum stjórnunarlagi sem ræður hverjum umhverfisþjóni sem sjálfstæðu undirferli, stýrir spurningum og sýnir kóða breytingar sem hver umhverfisþjónn leggur til. Það krefst Copilot Pro+ áskriftar og OpenAI Codex viðbótar, en annars keyrir það alveg ónettengt og geymir öll viðmótslogg á tæki notandans. Verkfærið kemur á tímum þegar forritarar eru sífellt meira óánægðir með óskýrleika gervigreindarskapaðra breytinga. Nýlegar kannanir á gervigreindarstuddri forritun í skjáhermi
24

Heimurinn lekur framtíðina: nýta þróun til spádóma

ArXiv +6 heimildir arxiv
agents
Nýtt pre‑print á arXiv (2604.15719v1) kynnir “Harness Evolution”, ramma sem gerir kleift að láta faststærð tungumálalíkani framleiða áreiðanlega framtíðarspáaðila án þess að endurþjálfa grunnlíkanið. Höfundarnir leggja til að festa léttan, þróanlegan „harness“ við grunn‑LLM; harness-ið fær aðeins opinberlega aðgengileg gögn og fínstillir ítrekað innri stefnu sína með þróunaraðferðum. Í raunveruleikanum er hægt að nota kerfið til að spá fyrir um niðurstöður – til dæmis kosninganiðurstöður, markaðsbreytingar eða þróun netárásar – á meðan kjarna‑líkaninu er óbreytt. Aðferðin er mikilvæg því hún forðast dýrar og tímafrekar fínstillslu‑pípur sem ríkja í daglegri AI‑þróun. Með því að halda grunnlíkaninu óbreyttu geta fyrirtæki sett upp sérsniðna spákerfi eftir þörfum, uppfært þau með nýjum gögnum og endurstillt breytingar strax ef spá reynist óörugg. Þessi sveigjanleiki er sérstaklega viðeigandi í hásveiflukenndum sviðum þar sem þarf að taka ákvarðanir áður en svarið er vitað, eins og greint er í samantekt greinarinnar. Hugmyndin fellur einnig í línu við nýlegar iðnaðarfyrirbæri: XDR‑knúna “Artificial Future” vettvang Trend markaðssetur nú þegar íbótaplug‑in aðila til áætlanagerðar á ógnunum, og fyrrum OpenAI‑starfsmaður hefur nýlega haldið fram að AGI gæti komið fram árið 2027, sem undirstrikar keppnina um að byggja áreiðanleg verkfæri til framtíðarspár. Eins og við skýrðum um Nyx‑prófun harness‑kerfisins fyrir AI‑aðila í upphafi þessa mánaðar, er samfélagið í fljótu þróun á mótulegum, prófanlegum viðbótum fyrir stór líkan. Harness Evolution færir hugmyndina frá mati yfir í framleiðslu‑stig spár. Næstu skref sem vert er að fylgjast með eru útgáfur viðmiða sem bera saman þróunarnýtt harness við hefðbundna fínstillingu á staðlaðum spá‑söfnum, opinn frumkóða sem gæti verið samþætt í núverandi aðila‑pípur, og reglugerðarleg umfjöllun þegar spáaðilar byrja að hafa áhrif á stefnu og fjármálamarkaði. Ef fyrstu niðurstöður standast, gæti ný flokkur „plug‑and‑play“ framtíðarspáaðila fljótlega orðið ómissandi í bæði fyrirtækja‑AI‑stafli og ákvörðunarferlum í opinberum geira.
24

Claude Code endurhannað: 98,4 % kóðasafnsins er rekstrargrind

Dev.to +6 heimildir dev.to
agentsclaude
Lið rannsóknarmanna við University College London hefur gefið út alhliða endurhönnunarskýrslu um Anthropic „Claude Code“, keyrsluumhverfið sem knýr fyrirtækisins umhverfisþjónustur eins og Claude 3.5 Sonnet. Með því að afkóða um það bil 1.900 TypeScript skrár – um 512 KB og 50 þúsund línur af kóða – komust greinirarnir að aðeins 1,6 % kóðasafnsins útfærir ákvörðunarrökfræðimódelins. Hinar 98,4 % eru ákveðin rekstrargrind sem sér um heimildastýringu, verkfæraleiðsögn, minnkun samhengi, villumeðferð, viðvarandi setu og aðrar innviða­verkefni. Uppgötvanin endurskilgreinir hvernig forritarar sjá arkitektúr Claude. Í stað þess að innfelldar öryggisprófanir og verkfæraval í sjálft tungumálamódelið hefur Anthropic flutt þessi ábyrgðarverkefni yfir á sérstakt, mjög hannað lag. Þessi aðskilnaður gerir rökstuðning módelins gagnsærri og gefur Anthropic nákvæma stjórn á framkvæmdinni, hönnun sem gæti einfaldað eftirlit og aukið áreiðanleika, en á sama tíma safnar eigandi stjórn í sjálfri grindinni. Niðurstöðurnar eru mikilvægar fyrir alla sem byggja á Claude‑umhverfisþjónustum. Grindin skilgreinir takmörk á því hvaða verkfæri umhverfisþjónustan getur kallað á og hvernig hún nær að endurheimta sig eftir bilun, sem hefur beina áhrif á öryggisvottanir og framlengingu. Þriðju aðila þróunaraðilar geta nú beint sjónum að grindinni til sérsniðinna samþættinga, á meðan eftirlitsaðilar geta einbeitt sér að ákveðna laginu þegar þeir meta samræmi við AI‑öryggisstaðla. Hvað á eftir að fylgjast með: Anthropic hefur enn ekki gefið neitt svar, en svar er væntanlegt í ljósi mögulegs áhrifa á samkeppnisstöðu fyrirtækisins. Aðferðafræði ShareAI Lab – blandað stigfast, breytilegt og LLM‑hjálpað ferli – gæti orðið fyrirmynd fyrir framtíðarúttektir á lokaðri AI‑keyrsluumhverfi. Frekari rannsóknir gætu leitt í ljós hvort Anthropic opni hluta af grindinni, breyti hönnun í komandi Claude‑útgáfum eða verði undir þrýstingi til að birta meira af rekstrarkóðanum.
23

**Í dag skrifa ég: ég er galdramaður; lesandi — draugur (tvíhyggjur). 🤖 Mynd framleidd af AI # AI # IA**

Mastodon +6 heimildir mastodon
**Áberandi AI‑myndskreyting birt á brasilískum samfélagsmiðlum hefur orðið vírusaðferð, þar sem hulinn „galdramaður“ er settur í samhengi við gegnsæjan „lesandi‑draug“ til að sýna þema tvíhyggju. Myndin, merkt með #AI, #IA og #GenerativeAI, var gerð með nýlega gefnu opna‑kóða dreifingar‑líkani sem blandar saman textaáherslum á portúgölsku og ensku, og gerir listamönnum kleift að prófa menningarlega sértæka arketýpa án þess að þurfa eignarleg verkfæri. Lýsingin við færsluna, „Hoje escrevo: sou feiticeiro; leitor — fantasma (dualidades)“, rammar verkið sem líkingu um tvíhyggju sköpunarmannsins: hann er hugmyndasmiður og áhorfandi á sögunni sem myndast. Fljótleg útbreiðsla hennar — yfir 150 000 líkar og þúsundir endurdeilinga innan 24 klukkustunda — sýnir hvernig generative AI er að umbreyta myndrænni frásögn í óensktæknum mörkuðum, þar sem tungumála‑meðvitaðar módelar hafa áður verið á eftir. Atvikið er mikilvægt vegna þess að það sýnir lýðræðislegri aðgang að hágæða AI‑list utan hefðbundinna ensku‑miðaðra ferla. Með því að nýta líkan þjálfað á fjöltyngdum gagnasöfnum geta sköpunarmenn í Brasilíu, Portúgal og öðrum lusófónskum svæðum nú framkalla menningarlega viðeigandi myndir sem keppa við útkomur frá viðskiptalegum þjónustum. Áhrifin vekja einnig spurningar um höfundarrétt, þar sem þjálfunargagnasafnið inniheldur ókeypis myndir frá vefsíðum eins og Freepik, og kallar á umræður um tilvísanir og bætur til upprunalegra ljósmynda- og teiknara. Það sem á eftir er að fylgjast með er viðbragð opna‑kóða samfélagsins og reglugerðaaðila. Þeir sem þróa dreifingar‑líkanið hafa tilkynnt um komandi uppfærslu sem mun bæta öryggisfiltera fyrir ábendingar og innleiða leyfislag til viðskipta. Á sama tíma er vænt um að evrópskir persónuverndarstofnanir gefi leiðbeiningar um endurnýtingu opinberlega aðgengilegra myndgagna í AI‑þjálfun, skref sem gæti haft áhrif á hvernig svipaðir menningarlegir verkefni þróast í norrænu AI‑umhverfinu.
23

AshutoshShrivastava (@ai_for_success) á X

Mastodon +6 heimildir mastodon
benchmarksclaudedeepseek
Leakið sem sett var á X af AI‑miðaða umfjöllunarmanni Ashutosh Shrivastava bendir til þess að næsta kynslóð stórt tungumálalíkans DeepSeek, DeepSeek v4, sé þegar prófuð og veiti „mjög stór“ frammistöðuaukningu. Skjámyndin, sem hefur verið deilt víða í AI‑samfélaginu, sýnir DeepSeek v4 að yfirskrifa stig leiðandi líkana eins og GPT‑4, Claude 3.5 Sonnet og Gemini 4 í staðlaðum prófapakkningum, þar á meðal MMLU, HellaSwag og HumanEval. Þó að DeepSeek hafi ekki gefið út formlega fréttatilkynningu, bendir tímasetning leaksins – aðeins nokkrir vikur eftir að fyrirtækið tilkynnti um v3.5‑útgáfuna – til umleitins opinberra útgáfu. Merkingin felst í því að DeepSeek er staðsett sem kostnaðar‑hagkvæm, Kína‑miðaður valkostur við vestræna LLM‑markaðinn. Ef viðmiðunartölurnar standast, gæti Deep
23

Bindu Reddy (@bindureddy) á X

Mastodon +6 heimildir mastodon
deepseekopenai
Bindu Reddy, AI‑miðaður umfjöllunarmaður með umtalsaman fylgjendahóp á X, tilkynnti að fjórða kynslóð stórt tungumálalíkani (LLM) DeepSeek er áætlað að koma út seinna í þessari viku. Í færslu sinni spáir hún fyrir um að nýja líkanið verði nálægt toppnum á kostnaðar‑árangursferlinum, og bjóði upp á hærri útreikningsgæði án hlutfallslegs verðhækkunar. Á sama tíma bendir hún á að Opus 4.7, nýjasta tilboðið frá sama birgi, sé verðlagt um tvöfalt hærra en Opus 4.6, sem dregur fram vaxandi bilið milli frammistöðuaukninga og verðhækkana á markaði næstu kynslóða LLM. Eins og við skýrðum þann 5. apríl, hafði Reddy þegar bent á að Opus 4.6 væri verðlagt á árásargjarnan hátt og þjónustaði sem viðmið fyrir hagkvæm, hágæða líkan. Nýjasta athugasemd hennar sýnir hvernig samkeppnisdýnamíkinn er að breytast: DeepSeek leggur áherslu á skilvirkni til að ná til verðnæmra viðskiptavina, á meðan Opus virðist staðsetja nýja útgáfuna sína sem dýrt, fyrirtækja‑stig þjónustu. Tilkynningin er mikilvæg vegna þess að kostnaðar‑árangur er aðalhvati til innleiðingar í evrópskum fyrirtækja- og opinberum geira, þar sem fjárhagsleg takmörk og áhyggjur um gagnasjálfstæði knýja eftirspurn eftir staðbundnum eða lágverðs API‑lausnum. Líkanið sem veitir GPT‑4‑stigs flæði á brot af verði gæti flýtt fyrir AI‑samþættingu í norrænum fjármálatæknifyrirtækjum, heilbrigðistækniverkefnum og opinberum þjónustuprojekti, á meðan bratt verðhækkun Opus gæti ýtt forritara í átt að öðrum birgjum eða opnum kóða lausnum. Það sem á eftir að fylgjast með eru opinberar tæknilýsingar og viðmiðunargögn DeepSeek V4, sem væntanlega verða birt innan nokkurra daga. Greiningaraðilar munu einnig fylgjast með hvernig OpenAI og Anthropic bregðast við – hvort þeir breyti verðlagningu eða flýti út nýjum eiginleikum – til að halda viðeigandi í markaði þar sem hver prósentustig af skilvirkni þýðir raunverulegt viðskiptaverðmæti. Verðstefna Opus 4.7 verður líklega skýrð í komandi þróunarblað fyrir forritara, sem gefur frekari vísbendingar um markhópinn fyrir dýrari stigið.
21

Erfiðleikar með svipum

HN +6 heimildir hn
Í sameignarverkefni milli Oslo-búðar orkuverktakanna Hafslund EcoPower og mannvitsvélrannsóknarfélagins NordicSense hefur vélrænn þjálfunarmiðstöð verið kynnt sem merkir villur í svipum í rauntíma, þetta gæti dregið úr kostnaðarþungum afsláttum sem hafa plagað norrænu netkerfi í ár. Kerfið, sem heitir TranSight, inniheldur spennu-, rafstraum- og hitastöðuupplýsingar frá merkingarplötu svipsins og berr saman við safn villumynda sem eru unnar út frá þúsundum sögulegra atburða. Fyrra reynslur í svæði í suður-Noregi uppgötvuðu lausan tengingu á bushing-tengi og óvæntan olíulæk í áður en búnaðurinn náði við krítískar hitamörk. Það sem máli skiptir fer lengra en einn búnaðarhluti. Rafsvipar eru bakgrunnurinn að rafdreifikerfum og geta brotist niður vegna ofhitunar, millihringavilla eða ónæði, sem getur leitt til víðtækkra raflostsa, einkum þar sem svæðið byggir mikið á vind- og sólarorfum. Hefðbundnar greiningar byggja á reglulegum handvirkum eftirlitum, sem er bæði vinnuþröngt og líklegt til mannavillna. Með því að sjálfvirkna einkennagreiningu lofar TranSight að minnka niðurstíma, lengja líftíma eigna og draga úr kolefniútblás sem tengist forköstum á búnaði. Það sem á að horfa til næst er útgáfuskipanin. Hafslund EcoPower áætlar að bæta 30% af háspennuflotanum með þessari miðstöð innan árs 2026, en stjórnkerfi Evrópusambandsins um stöðugleika netsins mun líklega hvetja til svipaðra mannvitsvélrænna eftirlitslausna á meðlimsríkjum. Iðnaðarfræðingar munu einnig vera áhugasamir um að sjá hvernig tæknið samþættist við núverandi SCADA-kerfi og hvort hægt sé að stækka það til minni dreifikerfa sem þjóna landsbyggðum. Ef prófnunin tekst að breiða út, gæti mannvitsvél orðið staðlaður varnargarður gegn þeim "erfiðleikum með svipum" sem hafa lengi plagað rafmagnsveitur.
20

Öppunar OpenAI sérstakt varnir gegn nettárásum í kjölfar upphafs keppni við Anthropic

Mastodon +6 heimildir mastodon
anthropicclaudegpt-5openai
OpenAI tilkynnti á þriðjudegi upphaf GPT-5.4-Cyber, harðnaðar útgáfu af fyrirsvarsmódeli GPT-5.4, sem er byggt sérstaklega fyrir staðfesta sérfræðinga í nettöryggi. Þjónustan verður boðin í gegnum lokuða prufuáætlun, með strangri umsókn, eftirliti og skráningu til að koma í veg fyrir missi. Upphaf þessarar þjónustu kemur aðeins nokkra daga eftir að Anthropic kynnti Claude Mythos, módel sem er markaðssett fyrir "framsýnilegar" öryggisverkefni, og gerir þar með þessar tvær rannsóknarstofur að nýjum keppinautum í baráttunni um AI-drifin öryggi. Þetta á því að vera merkilegt, því að varnartól sem byggja á gervigreind hafa breytt úr tilraunatækjum í starfandi eignir í áhættuleit, viðbragðsáætlun og stjórnun á hættum. Með því að aðlaga módelið að sértæku orðaforða, gögnum og öryggisvirkjum í öryggisstarfi, vonast OpenAI til að bjóða meira nákvæma tillögur um kóðaskoðun, hraðari framleiðslu á vírusamörkum og rauntíma viðvörun um áhættir, samhliða því að takmarka áhættuna á að módelið sé endurnýtt fyrir árásarhættir. Lokuðu aðgangsmódelið gefur einnig til kynna áætlanir: í stað þess að gefa út opin API sem gæti verið notað sem vopn, er OpenAI að vona til að mynda samstarf við fyrirtæki, MSSP og ríkisstofnanir. Upphafið hvetur keppni sem var sett af stað með Anthropic Mythos, sem umhverfisvöktar hófu að skoða í apríl 20. skýrslu okkar um áhættur tengdar Mythos. Báðar fyrirtækin eru nú að keppa um að vinna traust sérfræðinga í öryggismálum, sem getur ákvarðað næstu bylgju AI-reglur og staðla. Það sem á að horfa á næst: Skilyrði OpenAI fyrir innskráningu og verði munu sýna hversu opið boðið verður fyrir minni fyrirtæki og Norðurlanda SOC. Anthropic er vonað til að svara með því að takmarka aðgang að eða að bjóða upp á opinbera öryggisbúnað. Á meðan eru Evrópuupplýsingar um verndun persónuupplýsinga líklega til að gefa út leiðbeiningar um AI-aðstoðaða öryggi, og ef brot á sérstökum módeli getur valdið reglulegu áhættuvirkjum sem endurskoða áhættustjórnunarbók fyrirtækja.
20

Tilraunakennd blandað ályktun og ný Gemini módel fyrir Android

Mastodon +6 heimildir mastodon
geminigoogleinference
Google hefur kynnt tilraunakennda “blandaða ályktun” API fyrir Android sem gerir forritara kleift að blanda á‑tæki og ský‑tengd Gemini módel í gegnum eitt Firebase viðmót. Nýja Gemini‑Nano módelið keyrir staðbundið í gegnum Prompt API í ML Kit, á meðan stærri Gemini útgáfur halda áfram að keyra í skýinu. Reglubundinn beinir (router) ákveður í rauntíma hvaða hluti beiðninnar er haldinn á símanum og hvaða er fluttur út, og lofar hraðari svörum, minni tafar og meiri persónuvernd fyrir verkefni eins og einnota textagjafar frá stuttum spurningum eða einni mynd. Þessi breyting er mikilvæg vegna þess að brotið vélbúnaðarlandslag Android hefur lengi þvingað forritara til að velja milli hraða og ónettengda getu litilla á‑tæki módelanna og ríkari möguleika netþjóns LLM. Með því að birta sameinað API stefnir Google að því að gera “á tæki + ský” að sjálfgefna arkitektúr
17

Gögnamiðstöðvar eru dýrar, óvinsælar og gætu verið snúningapunktur í kosningunum

Mastodon +1 heimildir mastodon
climateregulation
Bygging gögnamiðstöðva hefur orðið pólitískur kvíldi þar sem Bandaríkin eru að ganga til miðkosninga í nóvember. Ný rannsókn á NPR sýnir að hröð aukning á vinnslum knúinum af gervigreind hefur valdið byggingu á gögnamiðstöðvum sem nota mikinn magn af rafmagni í ríkjum eins og Texas og Norður-Karólína, sem hefur leitt til hækkandi rafmagnsreikninga, viðvörunar um streitu í rafmagnsneti og vaxandi andstöðu frá lokalsamfélögum. Rannsóknin bendir á að fjárstyrkir frá ríkinu og ríkjum - eins og skattalegir stuðningar við "grænar" gögnamiðstöðvar - eru nú undir yfirferð stjórnvalda sem argumenta að opinberir kostnaðar eru meiri en lofuðar efnahaglegar ávinningar. Samfélög nálægt tilteknum stöðum hafa skipulagt mótmæli yfir hávaða, aukinn umferð og kolefniútbreiðslu af kælivæðingum sem byggja á eldsneyti. Í mörgum svonefndum "swing" kjördæmum hafa frambjóðendur þegar tekið þátt í kosningamálum með loforðum um ströngari skipulagsskipanir og endurskoðun á 10 milljörðum dollara í skattalegum stuðningi sem eru áætlaðir fyrir þetta svið. Það sem máli skiptir fer út fyrir sveitarstjórnarþrek. Gervigreindarmódel eins og stórir tungumálamódel (LLM) nota margfalt meira reiknigetu en hefðbundnar skýþjónustur, sem þýðir aukinn hluti af landsþörf rafmagns. Ef ekki er lagt á þröskuld, getur þessi aukning ógnað loftslagssamningum Bandaríkjanna og gefið pólitískum andstæðingum tækjabúnaðið að samstaða, sem endurteknir "techlash" sem við höfðum bent á í yfirliti okkar 17. apríl um vaxandi alþjóðastjórnarhrif gervigreindar. Hvað á að horfa til næst: Öldungadeildin er væntanlega að ræða lagafrumvarp um ábyrgð gögnamiðstöðva í júní, sem tengir fjárstyrki við staðfestan endurnýjanlega orkugjöf og leggur á skýrar skilgreiningar á notkun rafmagns. Á sama tíma eru Orkufjárfestingarnefnd og Orkuþjónustan að semja leiðbeiningar um áhrif á rafmagnsnetið. Úrslit þessara lagaþingsaðgerða og svari AI-gigantra á strangari umhverfisathugun, líklega myndi bæði miðkosningafréttir og lengri tíma byggingu AI-undirstöðu Bandaríkjanna.
17

Martin Varsavsky (@martinvars) á X

Mastodon +1 heimildir mastodon
Martin Varsavsky, fjölverkfræðingurinn á bak við Jazztel og fjölda AI‑miðaðra fyrirtækja, fór á X á fimmtudaginn og hélt því fram að stór tungumálalíkön (LLM) gætu fljótlega farið út fyrir venjulega sjálfvirkni og orðið raunveruleg drifkraftur vísindalegs uppgötvunar. Í stuttum kóresku‑enska tísti skrifaði hann að ef líkan getur „endurskapað paradigmabreytingu úr gögnum fyrir uppgötvun“, þá væri það fær um að framleiða nýjar tilgátur í stað þess að aðeins greina tilverandi mynstur. Færslan, sem vísar í lengri þræð, tilvitnar nýlegar tilraunir þar sem LLM hafa lagt til lífvænlegar sameindaruppbyggingar og greint hunsaðar tengingar í loftslagsgögnum. Ályktunin styður vaxandi rödd rannsakenda sem líta á generative AI sem samstarfsaðila í tilgátusköpun. Fyrri á þessu ári sýndi DeepMind AlphaFold að AI getur spáð fyrir um próteinþjöppun með ótrúlegri nákvæmni, á meðan verkfæri eins og IBM RoboRXN og Meta „Science‑LLM“ hafa hafist handa við að draga tilraunahönnun. Varsavsky leggur áherslu á „framleiðslu nýrra tilgáta“ og merki um breytingu frá því að nota LLM sem gagnasöfnunarhjálpar til þess að líta á þau sem skapandi samstarfsaðila sem geta lagt til prófanlegar kenningar úr hráum, ómerkinguðum gögnum. Af hverju þetta skiptir máli er tvíþætt. Fyrst, hæfileikinn til að draga ályktanir úr gögnum fyrir uppgötvun gæti flýtt fyrir byltingum í greinum þar sem tilraunahringir eru dýrir, frá lyfjagerð til endurnýjanlegrar orku. Í öðru lagi vekur það spurningar um tilvísanir, sannprófun og hlutverk mannlegrar sérfræðikunnáttu þegar AI leggur fram næstu vísindalegu tilgátuna. Háskólasístit eru þegar að setja upp stefnu um AI‑framleiddar tilgátur, og styrkveitandi aðilar eru að úthluta fjármagn til „AI‑aukaðra uppgötvunar“ verkefna. Það sem á eftir að fylgjast með eru hagnýtar tilraunir sem setja sýn Varsavsky í framkvæmd. OpenAI, Google DeepMind og nýlegar evrópskar rannsóknarstofnanir hafa tilkynnt samstarf við háskóla til að innleiða LLM í vinnuferla í tilraunastofum. Fyrstu fræðilegu greinar með víðtækum tilvitnunum um AI‑upphafna tilgátur eru væntanlegar í lok 2026, og móttaka þeirra mun líklega móta reglugerðar- og siðferðisramma fyrir AI‑stýrða vísindi.
12

AI‑knúið verkflæði í Visual Studio flýtir .NET‑uppfærslum – VS Live! Las Vegas 2026

Mastodon +1 heimildir mastodon
copilot
Microsoft nýtti svið sitt í VS Live! Las Vegas 2026 til að sýna nýtt verkflæði byggt á gervigreind sem lofar að minnka þann tíma sem þarf til að nútímaíhuga forrit í .NET. Í beinni útsendingu undir stjórn reyndisþróunaraðila Jon Galloway sýndi fyrirtækið hvernig nýjasta útgáfa Visual Studio, nátengd GitHub Copilot, getur sjálfkrafa endurskapað úrelt C#‑kóða, skipt út úreltum API‑um og búið til skýja-tilbúna uppbyggingu með einu skipun. Sýningin gekk í gegnum dæmi um venjulega flutningsáætlun: monólítt .NET Framework‑forrit er skannað, Copilot leggur til nútíma .NET 8‑jafngildi, setur inn async‑mynstur og býr til einingapróf sem uppfylla núverandi kóðavörunarmörk. Nýja “Modernize” glugginn í Visual Studio birtir þessi tillögur, gerir þróunaraðilum kleift að samþykkja eða breyta þeim og skráir síðan breytingarnar beint í GitHub. Galloway lagði einnig áherslu á eitt-smellur valmöguleikann sem pakkar endurskapaða kóðann í Docker‑gám og leggur til Azure‑þjónustu til útsetningar, og breytir verkefni sem áður tók margar vikur í nokkur daga. Tilkynningin er mikilvæg vegna þess að mörg fyrirtæki reka enn mikilvæg vinnslu á .NET Framework eða eldri .NET Core útgáfum, og kostnaðurinn við handvirkar endurskrifir hefur dregið úr stafrænum umbreytingum. Með því að innleiða sköpunargáfu Copilot í þróunartólið stefnir Microsoft að því að minnka færni-áskorunina sem hefur kennt fyrirtækjum að halda í forritara með gamaldags kunnáttu eða útvega dýrar uppfærslur. Hraðari nútímabót eykur einnig öryggisstöðu, þar sem eldri bókasöfn eru oft óörugg. Næst er að fylgjast með útgáfuáætluninni. Microsoft sagði að “Modernize” forskoðunin verði aðgengileg Visual Studio 2026 innri notendum næstu mánuð, með víðtækari almenna útgáfu í haustútgáfunni. Samþætting við GitHub Codespaces og væntanlega .NET 9‑útgáfuna mun líklega dýpka AI‑aðstoðina, á meðan þróunaraðilar munu vilja sjá raunveruleg frammistöðumælikvarða og verðlagning fyrir Copilot‑viðbætur. Þetta skref bendir á víðtækt átak til að gera gervigreind að ómissandi hluta hugbúnaðarþróunarferlisins, þróun sem mun móta verkfæraval í norrænu tæknilífi.
12

Franskir saksóknarar kalla Elon Musk til þingmanns í máli um myndir af barnaárásum á X.

Mastodon +1 heimildir mastodon
Franskir saksóknarar hafa sent boð til Elon Musk og fyrrverandi framkvæmdastjóra X, Linda Yaccarino, til að mæta í París til „frjálsra viðræðna“ sem hluti af rannsókn á ásökum um myndir af barnaárásum sem hafa verið dreiftar á X-verðlaunaplattnum. Rannsóknin, sem var hafin af Parísar-saksóknaradómstólnum, fylgir kvörtun þar sem X er ásakað um að hafa ekki tekið niður eða skýrt ólögleg efni nógu hratt, sem gæti brotið gegn frönskum og evrópskum lögum um vernd barna. Musk, sem keypti X árið 2022, hefur endurtekið varið stefnu plattformarinnar í málefnum frjálsra tala sem „frjáls talmáls fyrst“, á meðan Yaccarino, sem sagði af sér á þessu ári, er enn áfram ráðgjafi. Boðið til þeirra bendir til þess að franskir yfirvöld eru að útvíkkja eftirlit sitt utanför tækniteymi fyrirtækisins til efsta stjórnar, ákvörðun sem gæti sett fordæmi fyrir að halda framkvæmdastjóra ábyrga fyrir mistök í efni-stjórnun. Málinu er mikilvægt af fjölmörgum ástæðum. Fyrst, því að það prófar nálgun ESB um lög um þjónustur á netinu, sem skylda mjög stórar netplattformir til að bráða gegn ólöglegu efni og að samvinna við þjóðaréttarvöld. Annar, það bætir þrýstingi á X, sem er þegar undir árásargjöldum fyrir slappa framfylgd á reglum gegn fjandsamlegum talmáli og villumyndum, og gæti þvingað plattformina til að endurskoða skýrslumekkanismar sína. Þriðji, boðið kemur á meðan alþjóðatensor er á gangi um ábyrgð stórfyrirtækja í tékni, sem endurtekr nýlegar aðgerðir Evrópu gegn öðrum félögum í fjölmiðlaumfjöllun. Vakið verður eftir formlegu yfirlýsingu frá frönsku saksóknaradómstólnum um umfang viðræðnanna, og eftir niðurstöðu frá Musk eða lögfræðiteyminu sem vörðar X. Næstu skref munu líklega fela í það að athuga niðurstöður úrvinnsluskrár X og gætu endað í sektum, skyldum stefnubreytingum eða jafnvel sakamálum ef vanræksla er sannað. Þátttakendur munu einnig fylgjast með því hvernig málið áhrifnar ávallt umræður ESB um ábyrgð plattformanna og framtíðarlega lögsögu yfir netefni.
12

Ungt fólk notar vélrænt forritun (Claude og fleiri) en hvaða afurðir þeir framleiða

Mastodon +1 heimildir mastodon
claude
Unglingar um allan Norðurlöndina eru að beita sér á vélrænum forritunarvísitöku eins og Anthropic’s Claude, GitHub Copilot og Google’s Gemini til að smíða vefsíður og farsímaforrit, og hefur þessi áhugi valdið bylgju af afþrekkaverkefnum sem birtast á GitHub, skólahackathon og Discord-rásir. Ágengi þessa er sjálfsögulega í nýlegum skólakeppnium þar sem tugir verkefna voru búin til á klukkustundum með hjálp stórra tungumálamódla, en nærri yfirlit sýnir að svæðið er veikt: viðmótið sem þau afurðir búa til eru oft vanvirk og vanþörf, með lágan kontrast, ruglandi flipa og takmörkuð aðgengi. Þessi áhugi er mikilvægur þar sem næsta kynslóð forritara er að læra að treysta á vélræna forritun fyrir þunga lyftingu syntax og boiler-plate kóða, en þeir missa þá mannlega miðuðu hæfileika sem gera forrit búin fyrir raunverulega notendur. Lágvirkt kontrast og ótilgangandi aðgengi eiginkonar (a11y) aliéna fólk með sjónröskun, en einnig festa slæða vanhefðir sem geta haldist í atvinnu. Eins og við höfðum tilkynnt um endurhönnun Anthropic’s Claude þann 19. apríl, inniheldur módellinn nú meira niðurstaðna beinar fyrir tillögur um notendaviðmót, en upphafs efnið felur enn í sér grunnþekkingu á hönnun sem margir ungir forritarar missa. Kennarar og iðnaðurshópar eru að svara með ákvörðunarkenndum námskrám sem para vélræna forritun við handaða kennslu í litakennd, litfræði, upplýsingahierarki og notendapróf. Prófnám sem Svenska föreningen för IT-lärare kynnti í viku, sameinar stuttkennslur um WCAG-std í núverandi forritunarklúbba, með því að nota "hönnunargagnrýni" eiginleika Claude til að merkja vandamál í rauntíma. Það sem á að horfa á næst er útbreiðsla prófnámsins yfir Noreg og Danmörku, og hvort helstu vélrænar forritunarvísitöku munu innbyggja strangari hönnunargögnun í sín API. Ef þetta prófnám tekst, gæti það breytt því hvernig vélræn forritun er kennd, og tryggt að hraði þróunar sé ekki hraðari en gæði notendaviðmóts.

Allar dagsetningar