AI News — 2026-04-18

547

Upphaf Claude Mythos frá Anthropic byggir á rangfærslu

Lobsters +8 heimildir lobsters

anthropicclaude

Claude Mythos‑líkanið frá Anthropic, sem hefur fengið mikið umfjöllun, er nú í brennide

Lobsters — https://www.artificialintelligencemadesimple.com/p/anthropics-claude-mythos-laun www.bbc.com — https://www.bbc.com/news/articles/crk1py1jgzko www.forbes.com — https://www.forbes.com/sites/jonmarkman/2026/04/08/what-is-claude-mythos-and-why www.nytimes.com — https://www.nytimes.com/2026/04/07/technology/anthropic-claims-its-new-ai-model- futurism.com — https://futurism.com/artificial-intelligence/anthropic-claude-mythos-escaped-san nypost.com — https://nypost.com/2026/04/08/business/anthropics-claude-mythos-model-sparks-fea Mastodon — https://fed.brid.gy/r/https://www.artificialintelligencemadesimple.com/p/anthrop Mastodon — https://mastodon.social/@PeterSoukup/116430877999161388

404

Anthropic hefur nýlega gefið Claude hönnunastofu. Þetta er hvað Claude Design raunverulega gerir.

Dev.to +7 heimildir dev.to

anthropicclaudefine-tuning

Anthropic kynnti Claude Design Studio á þriðjudaginn og setti lykil‑LLM‑kerfið sitt í beina keppni við hönnunarumhverfi Figma. Nýja vef‑stúdíóið gerir notendum kleift að lýsa UI‑hugmynd í náttúrulegu máli og fá fullkomna mótsýningu með vektor‑eignum, uppsetningartillögum og litasamsetningum sem passa við vörumerkið. Notendur geta síðan haldið áfram að betrumbæta með því að biðja Claude um að stilla bil, skipta um tákn eða búa til aðra leturgerð, allt innan eins viðmóts sem getur flutt út í hefðbundna hönnunarskrár (Figma, Sketch, Adobe XD). Útgáfan kemur í kjölfar nýjustu útgáfu Anthropic, Claude Opus 4.7, og fyrri “Claude Design” mótsýningar sem við skýrðum um 18. apríl 2026 og sem bentu á prótotýpu með áherslu á markaðssetningu. Af hverju þetta skiptir máli er tvíþætt. Fyrst fær generative AI frá kóða‑miðaðum aðstoðarmönnum eins og Claude Code inn í sjónræna hönnunarrásina, sem gæti minnkað verulega þann tíma sem hönnuðir eyða í lágnivå iteratíön og gert minni teymum kleift að framleiða hágæða frumgerðir án sérstakrar UI‑sérfræðinga. Í öðru lagi, með því að innbyggja líkanið í sérstakt stúdíó í stað viðbótar, forðast Anthropic “AI‑sem‑viðbót” líkanið sem hefur ríkir á markaðnum og setur í spurningu kröfu Figma um að vera eina miðstöð fyrir samvinnuhönnun. Ef Claude Design getur skilað áreiðanlegum, vörumerkjavænum niðurstöðum í stórum mæli, gæti það umbreytt verðlagningu og flýtt fyrir AI‑fyrsta hönnunaraðferðum hjá sprotafyrirtækjum og stofnunum. Það sem á að fylgjast með næst er útgáfa opinberrar beta sem áætlað er í júní, verðupplýsingar sem munu sýna hvort Anthropic stefni að áskriftarlíkani eða gjaldi á hverja framleiðslu, og hvernig Figma‑vörulíkan svarar—hvort sem er með hraðari eiginleikum eða AI‑samstarfi. Jafnframt verður mikilvægt að fylgjast með fyrstu notkunartölum frá hönnunartungum fyrirtækjum og öllum samþættingartilkynningum við núverandi Claude Code og Claude Opus API‑a Anthropic, sem gætu styrkt samræmda AI‑stafla fyrir bæði kóða og hönnun.

Dev.to — https://dev.to/om_shree_0709/anthropic-just-gave-claude-a-design-studio-heres-wh www.nytimes.com — https://www.nytimes.com/2024/12/13/technology/claude-ai-anthropic.html www.nytimes.com — https://www.nytimes.com/2023/07/11/technology/anthropic-ai-claude-chatbot.html www.mslinn.com — https://www.mslinn.com/llm/claude.html news.ycombinator.com — https://news.ycombinator.com/item?id=45002315 www.latent.space — https://www.latent.space/p/claude-code Dev.to — https://dev.to/lu1tr0n/claude-design-anthropic-lanza-su-rival-a-figma-con-opus-4

394

Kevin Weil og Bill Peebles yfirgefa OpenAI á meðan fyrirtækið heldur áfram að fjarlægja aukaverkefni

HN +8 heimildir hn

openaisora

Kevin Weil, yfirmaður vísindarannsóknarprógrams OpenAI, og Bill Peebles, skapari AI‑vídeóverkfærisins Sora, lýstu á föstudegi yfir að þeir séu að yfirgefa fyrirtækið. Brottför þeirra kemur í kjölfar þess að OpenAI minnkar “aukasíður” og einbeitir sér að fyrirtækjamiðuðu AI‑stefnu sem byggir á væntanlegu “superapp”. Weil hafði yfirumsjón með tilraunum OpenAI á sviði vísindalegs uppgötvunar, þar á meðal takmarkaða GPT‑Rosalind‑líkanið fyrir líffræðirannsóknir. Peebles leiddi Sora‑liðið, sem var lokað í síðustu mánuðinum eftir að OpenAI nefndi óheimilað reiknirit og breytingu frá tilraunakenndum fjölmiðlagerð. Báðar brottförir fylgja í kjölfar fjölda hækkandi stjórnendaskipta sem hófst í byrjun mánaðarins þegar rannsóknaaðstoðarmaðurinn Mira Murati hætti vegna heilsufarsvandamála og fyrirtækið tilkynnti víðtæka umskiptingu í framkvæmdastjórnun sinni. Þessar breytingar eru mikilvægar því þær merkja ákveðna stefnuviðskipti frá hásveifluðum, dýrum verkefnum í átt að vörum sem hægt er að græða í skjótri tíð í fyrirtækjamarkaðnum. Með því að safna hæfileikum í kringum hagnýtt AI vonast OpenAI til að flýta fyrir útgáfu superapp‑ins—einu sameinaðs viðmóts sem mun sameina spjall, kóða, myndir og framtíðarvídeóvirkni fyrir viðskiptanotendur. Missirinn á eldri rannsóknaforystum vekur þó spurningar um langtímahæfni fyrirtækisins til að framleiða byltingarkennda vísindi og gæti leitt til að keppinautar eins og Google DeepMind, sem heldur áfram að fjármagna könnunar AI‑vinnu, fái forskot. Það sem skal fylgjast með næst eru nýir tilnefningar í stað Kevin Weils og Bill Peebles, tímalínan fyrir beta‑útgáfu superapp‑ins og merki um hvort OpenAI muni endurlífa eða aðskilja vídeóframleiðslu eignir sínar. Næstu vikur ættu einnig að sýna hvort þröngun í stefnu leiði til nýrra fyrirtækjasamninga eða hægari flæði í tilraunakenndum rannsóknaferlum.

HN — https://techcrunch.com/2026/04/17/kevin-weil-and-bill-peebles-exit-openai-as-com www.theverge.com — https://www.theverge.com/ai-artificial-intelligence/914463/openai-sora-bill-peeb www.wired.com — https://www.wired.com/story/openai-executive-kevin-weil-is-leaving-the-company/ www.businessinsider.com — https://www.businessinsider.com/openai-executive-departures-shake-up-leadership- www.ainews.com — https://www.ainews.com/p/openai-s-chief-research-officer-resigns-following-murat Mastodon — https://defcon.social/@ai/116423217152622871 Mastodon — https://fed.brid.gy/r/https://www.wired.com/story/openai-executive-kevin-weil-is Mastodon — https://mastodon.social/@ai0news/116424197316409795

312

„Frelsisdagur“ hjá OpenAI þegar fjöldi yfirstjórnenda tilkynna brottför

HN +6 heimildir hn

openai

OpenAI tilkynnti á fimmtudag að fjöldi yfirstjórna myndi yfirgefa fyrirtækið, þróun sem samskiptadeild fyrirtækisins kallaði „Frelsisdagur.“ Brottfarirnar ná yfir yfirmann Sora‑vídeóframleiðslutýmisins, yfirmann Force Codex rannsóknardeildarinnar og tvo yfirstjórnenda vöruþróunar sem hafa haft umsjón með útgáfu o1‑rökfræðimódelins. Brottfarirnar voru staðfestar í stuttu innanhússminni og síðar endurspeglaðar í stuttu X‑færslu frá opinbera OpenAI‑reikningnum. Þessi umferð er nýjasta í röð af háttprofíls brottförum sem hafa hrædd stofnunina undanfarna vikur. Eins og við skýrðum 18. apríl, fór fyrrverandi yfirmaður Sora frá fyrirtækinu (sjá „Fyrri yfirmaður Sora hjá OpenAI fer“), og sama daginn sáum við brottfarir Kevin Weil og Bill Peebles, hluta af víðari „afhendingu hliðarverkefna.“ Nýja lotan af uppsögnum dýpkar áhyggjur um innri átök og ágreining um tilbúnað o1‑kerfisins, sem hindra OpenAI í að halda sér á undan keppinautum eins og Anthropic og Google DeepMind. Af hverju þetta skiptir máli er tvíþætt. Fyrst og fremst ógnaðir stjórnendaskipti geta seinkað útgáfu næstu kynslóða módelanna sem OpenAI hefur bent á að muni mynda grunninn að komandi GPT‑5 pakkanum, og gætu þannig látið keppinauta taka markaðsafl. Í öðru lagi koma brottfarirnar á tímabili þegar fyrirtækið er að sækja lögfræðilegan vernd í Bandaríkjunum, nýlega með stuðningi við lög í Illinois sem takmarkar ábyrgð vegna AI‑valdaðra fjöldaáfalla. Óstöðugur yfirstjórnunarteymi gæti veikja samningsstöðu OpenAI við stjórnvöld og fjárfesta, sérstaklega eftir að áhættufjárfestar skráðu stærstu nettölu sölu síðan 2010 á sama fimmtudag. Hvað á að fylgjast með næst: viðbrögð stjórnunar, þar á meðal bráðabirgðaúthlutun eða ytri ráðningar, og hvort útflutningurinn leiði til breytinga í vöruáætlun OpenAI fyrir o1 og GPT‑5. Greiningaraðilar munu einnig fylgjast með næstu fjármálaköllu fyrirtækisins til að leita eftir vísbendingum um hvernig mannauðsþörfin gæti haft áhrif á R&D‑útgjöld og komandi þróunarfundinn sem áætlaður er í júní.

HN — https://mas.to/@carnage4life/116422881496195720 remarkboard.com — https://remarkboard.com/m/sources-say-many-openai-staff-thought-that-o1-was-not- remarkboard.com — https://remarkboard.com/m/ice-to-increase-deportations-to-3000-illegals-per-day- trendswithfriends.com — https://trendswithfriends.com/blog/liquidation-day-or-liberation-day/ ledger.lumidawealth.com — https://ledger.lumidawealth.com/p/liquidation-day-or-liberation-day www.theautomaticearth.com — https://www.theautomaticearth.com/tag/liberation-day/

268

Staða sem sameinar samdráttarnet (CNN) og stuðningsvigursvél (SVM) til myndaflokkunar

Dev.to +7 heimildir dev.to

vector-db

Rannsakendahópur frá Indian Institute of Technology hefur kynnt hliðrunarlíkan sem sameinar samdráttarnet (CNN) með stuðningsvigursvél (SVM) til að auka nákvæmni myndaflokkunar. Rannsóknin, sem var sett á arXiv í þessari viku, skiptir hefðbundnu softmax‑lagi í lok CNN út fyrir SVM‑flokkara og fínstillir síðan sameinaða byggingu á viðmiðunargagnasöfnum eins og CIFAR‑10, ImageNet‑hluta og safni af læknisfræðilegum naglaöðrum. Tilkynndir ávinningar spanna frá 1,8 prósentustigum á CIFAR‑10 til áberandi 5,2 stigum á naglaöðrunasafninu, þar sem gögn eru fáin og ójöfnuður í flokkum er alvarlegur. Merkingin felst í því að takast á við tvö langtímavandamál djúpra sjónlíkana. Fyrst geta softmax‑lög að oflíkja þegar þjálfunargögn eru takmörkuð; SVM‑kerfi, með markmiðið um að hámarka bil, eru þolnari í umhverfi með litlum sýnum. Annars

Dev.to — https://dev.to/paperium/an-architecture-combining-convolutional-neural-network-c www.researchgate.net — https://www.researchgate.net/publication/321745073_An_Architecture_Combining_Con khazna.ku.ac.ae — https://khazna.ku.ac.ae/en/studentTheses/an-architecture-combining-convolutional jetir.org — https://jetir.org/papers/JETIR2410254.pdf archive.org — https://archive.org/stream/brain-tumor-classification-conv-neural/BrainTumorClas ojs3.unpatti.ac.id — https://ojs3.unpatti.ac.id/index.php/barekeng/article/download/12156/7939 Dev.to — https://dev.to/paperium/satellite-imagery-feature-detection-using-deep-convoluti

240

Caffeine.ai vs Replit: Af hverju ég breytti Vibe‑kóðun minni yfir á Internet Computer https://www. madeby

Mastodon +7 heimildir mastodon

agents

Bloggfærsla með áherslu á forritara, sem kom út á MadebyAgents í þessari viku, lýsir í smáatriðum handvirkri flutningi frá Replit‑kerfinu “vibe‑coding” yfir í Caffeine.ai og að lokum yfir á Internet Computer (ICP) blockchain‑ið. Höfundurinn, sem prófaði sex AI‑stýrð forritunarvettvang, fann að náttúrulega tungumálaviðmótið hjá Replit var notendavænt en var hamlað af óskýrum verðlagi, takmarkaðum útsetningarmöguleikum og vaxandi biðröð fyrir útreikningsauðlindir. Caffeine.ai, nýrari keppinautur sem lofar nánari samþættingu við stór tungumálalíkön (LLM) og fljótari iterasjónarhringum, virtist í upphafi leysa þessi vandamál, en eigið skýjaþjónustukerfi þess hélt áfram að innleiða birgðalás og áhyggjur varðandi persónuvernd gagna. Lykilþátturinn, samkvæmt höfundinum, var desentralíseraða arkitektúr ICP. Með því að þýða kóðann sem er framleiddur í “canisters” – sjálfstæðum snjallsamningum – geta forritarar sett í loftið fullkomlega virk vefforrit án hefðbundins skýjaþjónustuaðila, og njóta nær því engin hýsingarkostnaður, stjórn á keðjunni í sjálfvirkri stjórnun og innbyggðra táknauðkenna til að hvetja til nýtingar auðlinda. Færsla nefnir að ICP‑vistkerfið býður núna upp á tilbúin SDK‑pakki fyrir vinsælar LLM‑bakenda, sem gerir kleift að framkvæma “vibe‑coding” skipanir beint á netinu á meðan notandinn heldur yfir eigin gögnum. Af hverju þessi breyting skiptir máli er tvíþætt. Fyrst bendir hún til þess að AI‑hjálpað forritunarverkfæri séu að þroskast frá sandkassa SaaS‑umhverfum yfir í opna, forritanlegar innviði sem samræmast víðari Web3‑hreyfingu. Í öðru lagi er kostnaðarmunurinn áberandi: ICP getur hýst venjulegt Replit‑stíls forrit á brotum af sent í mánuði, sem er ákjósanleg tilboð fyrir sjálfstæða forritara og sprotafyrirtæki með takmarkað fjármagn. Áhorfendur í framtíðinni munu fylgjast með því hvernig komandi “Canister‑AI” keyrsluumhverfi ICP, sem er áætlað að koma í framkvæmd í þriðja fjórðungi 2026, einfaldar hýsingu líkana og hvort aðrir AI‑kóðunarvettvangar taki upp svipaðar desentralíseraðar útsetningarmódel. Jafnframt verður þróun staðla fyrir öryggi og uppruna skipana lykilatriði, þar sem meira forrit er framleitt og keyrt á opinberum blockchainum. Niðurstaðan gæti umbreytt efnahagslegum þáttum AI‑aukaðrar hugbúnaðarþróunar um allan Norðurlandastefna og lengra út.

Mastodon — https://mastodon.social/@craigbrownphd/116422293870881937 medium.com — https://medium.com/@ceo_44783/i-tried-every-vibe-coding-platform-so-you-dont-hav sourceforge.net — https://sourceforge.net/software/compare/Caffeine.ai-vs-Replit-vs-monday-vibe/ tech.co — https://tech.co/ai/vibe-coding/replit-alternatives www.pcbuildadvisor.com — https://www.pcbuildadvisor.com/replit-ai-vibecoding-a-brutally-honest-review-bui www.youtube.com — https://www.youtube.com/watch?v=tdFnOiyCwuM Mastodon — https://jforo.com/@yayafa/116424107490809359

193

# Tækni # Gagnagreining # Gagnasöfnun Hvernig á að láta Claude Code bæta sig úr eigin mistökum

Mastodon +10 heimildir mastodon

claude

Anthropic’s Claude Code hefur tekið skref í átt að sjálflærdóm, eins og nýtt kennsluefni á Towards Data Science, með titlinum „How to Make Claude Code Improve from its Own Mistakes“, lýsir. Leiðbeiningarnar sýna gagnavísindamönnum hvernig á að nota endurtekinn „spyrja‑endurskoða“ lykkju sem gerir Claude Code kleift að merkja, útskýra og sjálfkrafa endurskrifa gölluð kóðaútdrátt án mannlegrar íhlutunar. Með því að fanga villuskilaboð, senda þau aftur inn í módelið og nýta innbyggða greiningartól Claude til rauntíma keyrslu kóða, geta notendur breytt einu mistökum í keðju af smávægilegum umbótum. Þessi þróun er mikilvæg því Claude Code er þegar settur fram sem lágkóða samstarfsaðili fyrir greiningaraðila sem kjósa samtalsverkflæði fram yfir hefðbundna IDE. Eins og við skýrðum 17. apríl, kynnti Anthropic Claude Code vinnuferlið í takt við Opus 4.7 uppfærsluna, með loforð um nánari samþættingu við töflureikna, PDF skjöl og API pípur. Nýja sjálfleiðréttingarmynstrið minnkar „villuleit‑og‑síðan‑spurningar“ mótstöðu sem hefur takmarkað víðtækari notkun, sérstaklega í umhverfum sem vinna með stór, óuppbyggð gagnasöfn. Fyrstu notendur segja að þeir hafi náð um 30 % minnkun á handvirkum endurskrifum þegar þeir vinna með töflur með hálft milljón raðir, ávinningur sem gæti umbreytt því hvernig miðstærðarfyrirtæki ráða starfsmenn til gagna‑greiningarverkefna. Áhorfendur horfa til framtíðar þar sem Anthropic er áætlað að innleiða endurgjöfslúppu beint í Claude AI stjórnborðið, sem breytir handvirkum spurningum í varanlega námsrás. Áætlað er að nýja „Claude Code Auto‑Refine“ eiginleikinn verði hluti af áætlun Q3, og að opinn hugbúnaður viðbætur sem leyfa teymum að flytja út lagfærsluferilinn til fínstillingar verði í boði. Ef sjálfbætandi vinnuferlið skalar, gæti Claude Code orðið fyrsta samtalskóðarinn sem áreiðanlega lærir af eigin villum, og þéttir tengslin milli mannlegrar ásetnings og vélrænna framkvæmda í norræna AI umhverfinu.

Mastodon — https://mastodon.social/@craigbrownphd/116421798559953658 claude.com — https://claude.com/blog/analysis-tool www.dataquest.io — https://www.dataquest.io/blog/getting-started-with-claude-code-for-data-scientis vincent.codes.finance — https://vincent.codes.finance/posts/claude-code-data-analysis/ velvetshark.com — https://velvetshark.com/data-analysis-with-claude-code www.datastudios.org — https://www.datastudios.org/post/how-to-use-claude-for-data-analysis-complete-ov Mastodon — https://mastodon.social/@craigbrownphd/116421786963893819 Mastodon — https://mastodon.social/@craigbrownphd/116421786704343985 Mastodon — https://mastodon.social/@craigbrownphd/116421798382934819 Mastodon — https://mastodon.social/@craigbrownphd/116421680455284142

150

Að byggja ástandsvirka AI umboðsmenn með Backboard: Ítarlegur djúpdykkur í eiginleikum

Dev.to +6 heimildir dev.to

agentsautonomousvector-db

Backboard, nýja opna‑kóðasamskiptakerfið sem tilkynnt var í þessari viku, lofar að gera smíði á ástandsvirkum AI umboðsmönnum eins einfalt og að tengja saman nokkur Python‑einingar. Vettvangurinn inniheldur stjórnað vektorgagnasafn (Supermemory.ai), “Runner” samstillir sem fylgist með lotum, verkfæravirkja umboðsmenn og React‑byggt “assistant‑ui” framenda, á sama tíma og hann býður upp á innbyggða krækjur fyrir LangGraph og LangChain. Útgáfan felur í sér tvískjáa Streamlit‑sýningu sem gerir forritara kleift að bera saman óástands‑spjallmenni við Backboard‑knúinn umboðsmann sem heldur utan um samhengi milli umferð, kallar á ytri API‑kerfi og uppfærir sitt eigið þekkingargrunn í rauntíma. Þessi þróun er mikilvæg vegna þess að AI‑markaðurinn er að breytast frá einnota tungumálalíkönum yfir í sjálfstæð kerfi sem geta skipulagt, framkvæmt og lært í gegnum langtímaviðtöl. Viðhald ástands minnkar sóun á táknum, bætir áreiðanleika í áhættustýringu í netverslun og öðrum samræmisþörfandi sviðum, og opnar dyr fyrir “annars heila” forrit þar sem minni umboðsmannsins þróast í takt við notandann. Náttúruleg samþætting Backboard við vektorgagnasafn Supermemory þýðir að forritarar þurfa ekki lengur að flétta saman aðskilda geymslulag, á meðan Runner‑hlutinn tryggir keyrslu í sandkassa—vandamál sem við bentum á í skýrslu okkar frá 17. apríl um nýja sandbox‑SDK OpenAI. Áhorfendur í framtíðinni munu fylgjast með hversu fljótt Backboard verður tekið upp í vaxandi LangGraph‑vistkerfinu og hvort skýja‑hýst þjónustan geti haldið í takti við nýrri viðmiðanir eins og RiskWebWorld. Næsta umferð uppfærslna er væntanleg að innihalda fjöl‑umboðsmanna samstilltar aðgerðir og dýpri mann‑í‑rásinni stjórnun, sem gæti fest Backboard í sessi sem sjálfgefna verkfærakistu til að byggja framleiðslu‑gæðafullt, ástandsvirkt AI aðstoðartól. Þegar fyrirtæki prófa sjálfstæð umboðsmenn verður hæfni vettvangsins til að stækka minni á öruggan hátt lykilatriði.

Dev.to — https://dev.to/ranjancse/building-stateful-ai-agents-with-backboard-a-complete-f dev.to — https://dev.to/gaiaai/building-stateful-vs-stateless-ai-agents-a-deep-dive-with- www.youtube.com — https://www.youtube.com/watch?v=m3snsOuRLhU medium.com — https://medium.com/@glennlenormand/building-stateful-ai-agents-with-google-adks- multi-ai.ai — https://multi-ai.ai/de/blog/langgraph-tutorial-build-stateful-ai-agents-with-en www.langchain.com — https://www.langchain.com/blog/assistant-ui

148

Anthropic forstjóri mætir aðalstarfsmanni Hvíta húss í leit Bandaríkjanna að aðgangi að Mythos líkani

Mastodon +8 heimildir mastodon

anthropic

Forstjóri Anthropic, Dario Amodei, hitti aðalstarfsmann Hvíta húss, Susie Wiles, fjármálaráðherra Scott Bessent og aðra háþróaða starfsmenn á föstudegi til að ræða nýjasta stórt tungumálalíkani fyrirtækisins, Mythos. Fundurinn í Vesturhluta, sem þátttakendur lýstu sem „árangursríkur“, var fyrsta hárstigs samtalið milli stjórnvalda og AI-fyrirtækisins síðan Anthropic tilkynnti að það myndi fresta víðtækari útgáfu Mythos þar til það gæti tryggt öryggi líkanins og viðnámsþol gegn misnotkun. Fundurinn er mikilvægur vegna þess að Mythos er almennt talinn vera eitt af hæfileikaríkustu generative‑AI kerfunum á markaðnum, í samkeppni við lausnir frá Meta, Google og OpenAI. Bandarískir embættismenn eru spenntir að tryggja aðgang fyrir öryggis‑áætlanir, reglugerðarprófanir og til að meta hvort líkanið uppfylli nýrri öryggisstaðla. Anthropic glímir á sama tíma

Mastodon — https://defcon.social/@ai/116426982797972733 Mastodon — https://tldr.nettime.org/@remixtures/116425380613981753 www.nytimes.com — https://www.nytimes.com/2026/04/17/technology/white-house-anthropic-artificial-i www.pbs.org — https://www.pbs.org/newshour/politics/white-house-chief-of-staff-to-meet-with-an www.cnbc.com — https://www.cnbc.com/2026/04/17/anthropic-dario-amodei-trump-mythos.html nypost.com — https://nypost.com/2026/04/17/business/anthropic-ceo-dario-amodei-set-to-meet-wh thehill.com — https://thehill.com/policy/technology/5837086-anthropic-ai-white-house-meeting/ Mastodon — https://mastodon.social/@worldbrieflynews/116429471912393516

142

Hvað er Mythos og af hverju eru sérfræðingar áhyggjufullir um AI‑líkanið frá Anthropic

Mastodon +8 heimildir mastodon

anthropic

Anthropic nýjasta stórt tungumálalíkanið, Claude Mythos, hefur verið dregið úr opinberri útgáfu eftir að innri prófanir sýndu óviðjafnanlega hæfni til að finna og nýta sér hugbúnaðargalla í helstu stýrikerfum. Fyrirtækið tilkynnti að líkanið getur framkallað virk nýtingarkóða, kortlagt ferla til að auka réttindi og jafnvel búið til phishing‑gögn með lítilli mannlegri aðstoð. Nokkrum klukkustundum eftir tilkynninguna héldu fjármálaráðherrar, seðlabankar og eldri bankastjórar neyðarfundir og varðu við því að tækið gæti veitt illgjarnum aðilum „ofmannlega“ yfirburði í netárásum á lykilinnviði fjármálakerfa. Úrslitin hafa kveikt ábyrga þrýsting. Yfirstjórar upplýsingatryggingar og netöryggisfyrirtæki, sem gætu hagnýtt sér aukinn eftirspurn eftir varnarmöguleikum, krefjast opinberlega tafarlausrar aðgerða; greiningar segja að þessi hvati endurspegli sjálfverulega sjálfvernd stofnana jafnvel eins og raunverulega áhættumat. Evrópskar og bandarískar yfirvaldar eru nú þegar að útbúa neyðarreglur í samræmi við AI‑lögin og framkvæmdalöggjöf um AI‑knúna ógnir, á meðan nokkur landsöryggisstofnun hafa sett Anthropic á eftirlitslista. Af hverju þetta skiptir máli fer langt umfram eitt tiltekinn vara. Mythos sýnir að gerandi gervigreind getur flutt úr tungumálaverkefnum í sjálfstæða uppgötvun á öryggisgöllum, og minnkar tímabilið milli rannsókna og vopnabúnaðar sem hefðbundið hefur verndað verjendur. Ef slík hæfni verður almennt aðgengileg, gæti kostnaður við að verja stýrikerfi, bankakerfi og stjórnunarnet í ríki sprengst í loft, breyta netöryggismarkaðnum og kalla á endurskoðun á stjórnunarramma AI‑tækni. Það sem á að fylgjast með næst: nýja áhættustigun ESB um „tvínota“ líkön, möguleg lögfræðileg ágreiningur frá fyrirtækjum sem telja sig vera í áhættu, áætlun Anthropic um að gefa út harðaða, „sandkassaða“ útgáfu, og hvort samkeppnisaðilar reyni að innleiða svipaðar nýtingar‑einingar í eigin lausnir. Næstu vikur munu sýna hvort Mythos kallar á umbyrtingu reglugerða eða verður hvati að nýrri varnarmótstöðu í AI‑vopnakapphlaupi.

Mastodon — https://tldr.nettime.org/@remixtures/116422749764806834 www.scientificamerican.com — https://www.scientificamerican.com/article/what-is-mythos-and-why-are-experts-wo www.bbc.com — https://www.bbc.com/news/articles/c2ev24yx4rmo www.theguardian.com — https://www.theguardian.com/technology/2026/apr/10/anthropic-new-ai-model-claude www.bloomberg.com — https://www.bloomberg.com/news/features/2026-04-16/how-anthropic-discovered-myth www.wired.com — https://www.wired.com/story/anthropics-mythos-will-force-a-cybersecurity-reckoni Mastodon — https://igeek.gamer-geek-news.com/@feed/statuses/01KPF0MJ6FHC7X77MBNNZ0CPAH HN — https://www.ft.com/content/c9f5b690-a10e-4c66-9245-017f8bfbc7b4

124

Skilningur á Transformerum, hluti 9: Stökun sjálfhugsunar laga

Dev.to +6 heimildir dev.to

Nýjasta þáttur í “Skilningur á Transformerum” seríunni, sem kom út í dag, varpar ljósi á framkvæmdina að stapla sjálfhugsunar lag. Með því að byggja á þyngdar‑deilingu hugmyndunum sem voru greindar í hluta 8 þann 17. apríl, útskýrir nýja greinin hvernig mörg, sjálfstætt parametrísuð athyglublokkir eru sett í lag til að gera líkaninu kleift að ná yfir sífellt abstraktari tengsl innan runu. Höfundurinn fer í gegnum hefðbundnu hönnunina á eingöngu kóðunaraðila og eingöngu afkóðunaraðila sem kynnt var í upprunalega greininni “Attention Is All You Need”, og sýnir að hvert lag tengir fjölhöfuð sjálfhugsunar undireiningu við framþrýstingarnet. Með því að stapla þessi pör geta transformerar farið fram úr einlagatakmörkuninni sem var

Dev.to — https://dev.to/rijultp/understanding-transformers-part-9-stacking-self-attention en.wikipedia.org — https://en.wikipedia.org/wiki/Transformer_(deep_learning) earezki.com — https://earezki.com/ai-news/2026-04-17-understanding-transformers-part-9-stackin www.ionio.ai — https://www.ionio.ai/blog/a-deep-dive-into-the-function-of-self-attention-layers papers.neurips.cc — https://papers.neurips.cc/paper/7181-attention-is-all-you-need.pdf introml.mit.edu — https://introml.mit.edu/notes/transformers.html

118

Ivan Fioravanti ᯅ (@ivanfioravanti) á X

Mastodon +8 heimildir mastodon

agentsanthropic

Anthropic nýjasta tungumálalíkani, Opus 4.7, hefur kveikt á bylgju af áhuga meðal hönnuða eftir að tæknaráðgjafi Ivan Fioravanti sendi tíst þar sem hann lagði áherslu á „Lovable‑level“ áhrif líkanið hefur á vinnuferla við smíði forrita. Fioravanti, sem stjórnar AI‑miðaðum verkefnum hjá CoreView, sagði að hönnunargenereringar nýja líkanisins séu svo þróaðar að notendur íhuga að segja upp núverandi áskriftum að hönnunarverkfærum til að nota ókeypis, AI‑knúna lausnina. Opus 4.7 byggir á Anthropic „Claude“ ættinni en bætir við fjölbreytilegu kjarna sem getur túlkað sjónræna fyrirmæli, unnið ítrekað á UI‑útlitsgerð og lagt til hönnunarbætur í rauntíma. Snemma notendur tilkynna að líkanið geti framleitt hágæða vírulínur út frá einni setningarlýsingu, sjálfkrafa lagað litapallettu að vörumerkjareglum og jafnvel búið til front‑end kóðaútdrátt sem keyrir án handvirkrar fínstillingar. Hraði og nákvæmni þessara úttaka er áberandi skref frá fyrri Opus 4.0 seríunni, sem kröfðist umfangsmikillar eftirvinnslu. Þessi þróun er mikilvæg því hönnun hefur lengi verið flöskuháls í hugbúnaðarafhendingu. Með því að láta LLM taka á sig daglegan UI‑framleiðslu geta vöruteymi stytt þróunartímabil, minnkað áreiðanleika á sérfræðihönnuðum og lækkað kostnað. Fyrir breiðari AI‑markaðinn eykur frumúr Anthropic samkeppni við OpenAI GPT‑4.5 og Google Gemini‑1, og ýtir iðnaðinum í átt að sértækari, sviðsvísum líkanum frekar en almennum textagenerátorum. Það sem á eftir að fylgjast með er útfærsluáætlun Anthropic. Fyrirtækið hefur bent á stigveldisverðlagningarmódel sem gæti gert Opus 4.7 aðgengilegt nýsköpunarfyrirtækjum á meðan fyrirtækjareikningar yrðu rukkaðir fyrir hærri umferð í API. Samstarf við hönnunarvettvang eins og Figma, Sketch og Adobe XD er áætlað á næstu mánuðum, og samanburðarrannsóknir sem bera Opus 4.7 saman við samkeppniverkfæri eru áætlaðar til útgáfu seinna á þessu fjórðungi. Eins og við skýrðum 14. apríl er áskorunin nú ekki aðeins að byggja öfluga LLM‑a heldur að leiðbeina notendum um hvernig nota á þau án „töfrarútsendinga“ – próf sem Opus 4.7 mun brátt mæta í raunveruleikanum.

Mastodon — https://mastodon.sayzard.org/@sayzard/116423021615493316 x.com — https://x.com/ivanfioravanti threadreaderapp.com — https://threadreaderapp.com/user/ivanfioravanti github.com — https://github.com/ivanfioravanti huggingface.co — https://huggingface.co/ivanfioravanti www.darkreading.com — https://www.darkreading.com/author/ivan-fioravanti Mastodon — https://mastodon.sayzard.org/@sayzard/116423021659157821 Mastodon — https://mastodon.sayzard.org/@sayzard/116423021572465079

108

Claude Design, Opus 4.7 til baka, GPT‑5.3 og KIMI K2 viðmiðunartölur

Dev.to +6 heimildir dev.to

anthropicbenchmarksclaudegpt-5

Anthropic kynnti í dag Claude Design, umhverfi í vafra sem gerir notendum kleift að teikna, smíða og betrumbæta vefuppsetningar með aðeins einu skipun. Verkefnið byggir á hönnunarstúdíó‑prótotýpinu sem við fjölluðum um þann 18. apríl, þegar fyrirtækið opnaði “Design Studio” fyrir Claude, og bætir við sjónrænu striga, íhlutabókasafni og rauntímaforskoðun sem er knúin af nýjustu Claude Opus 4.7 líkaninu. Kynningin kemur í kjölfar fjöls konar kvörtunar frá forritara um að Opus 4.7 sé að sýna “alvarlega til baka” í áreiðanleika. Fyrstu notendur skrá í sér hærri tíðni af rangfærðum CSS-reglum og stundum hrun þegar unnið er með stórar táknaglugga, í skarpari mótsögn við viðmiðunartölur líkanins sem voru birtar í síðasta mánuði—87,6 % á SWE‑bench Verified og framúrskarandi yfir GPT‑5.4 í kóðunaráhrifamælingum. Anthropic hefur enn ekki gefið út formlegan lagfæringu, sem vekur áhyggjur um að hraði nýrra eiginleika sé að yfirgnæfa stöðugleika líkanins. Samtímis voru nýjar viðmiðunartölur um pólitískar hliðar í GPT‑5.3 og opna kóðann KIMI K2 gefnar út, sem varpa ljósi á hvernig stór tungumálalíkön bregðast við umdeildum spurningum. Prófanirnar, sem gerðar voru af sjálfstæðu samstarfi norrænna háskóla, sýna að GPT‑5.3 heldur 92 % hlutleysi, á meðan KIMI K2 stendur á 78 %, sem bendir til þess að Claude‑miðaða hönnunargögn gætu orðið áberandi keppnisforskot ef kjarnalíkanið nái að stöðvast. Hvað á að fylgjast með næst: Anthropic er líklegt til að gefa út lagfæringu fyrir Opus 4.7 innan næstu tveggja vikna, og fyrirtækið hefur bent á “Claude Design Pro” stig sem mun innleiða útgáfustýringu og hópsamvinnu. Á sama tíma hyggst viðmiðunarsamfélagið birta fjórðungsuppfærslu sem mun innihalda fjöltyngda hlutleysi-prófanir, mælikvarða sem gæti haft áhrif á ákvörðun fyrirtækja um innleiðingu í Evrópu. Hagsmunaaðilar ættu að fylgjast með bæði tæknilegri lagfæringu Opus 4.7 og þróun frammistöðu samkeppnisaðila í takt við að AI‑knúna hönnunarmarkaðurinn hitnar.

Dev.to — https://dev.to/soytuber/claude-design-opus-47-regression-gpt-53-kimi-k2-benchmar media.patentllm.org — https://media.patentllm.org/news/cloud-ai/claude-design-opus-4-7-regression-gpt- www.buildfastwithai.com — https://www.buildfastwithai.com/blogs/claude-opus-4-7-review-benchmarks-2026 artificialanalysis.ai — https://artificialanalysis.ai/articles/opus-4-7-everything-you-need-to-know www.vellum.ai — https://www.vellum.ai/blog/claude-opus-4-7-benchmarks-explained www.datacamp.com — https://www.datacamp.com/blog/opus-4-7

108

Anthropic sýnir Claude Design til að smíða glæsilegar nýjar bleikar pappírslipar fyrir markaðsteymi

Mastodon +7 heimildir mastodon

anthropicclaude

Anthropic kynnti Claude Design á föstudegi, rannsóknar‑forskoðunartæki sem gerir notendum kleift að búa til sjónræna eignir á markaðsstigi með því að bara spjalla við Claude‑líkanið. Frumgerðinni er hægt að framleiða allt frá borðbanni til „glæsilegra nýrra bleikra pappírslipa“ sem sýndir voru í kynningunni, og setur samtals‑gervigreindina sem framenda fyrir myndsköpun sem fer fram umfram hefðbundin hönnunartól. Útgáfan byggir á nýlegri útbreiðslu Anthropic í gerð kóða með Claude Code, umfjöllun sem við fjölluðum í byrjun vikunnar. Með því að stækka Claude-fjölskylduna yfir í sjónræna miðla stefnir fyrirtækið að því að lækka tæknilegan þröskuld fyrir framleiðslu á fínlegum myndum, skref sem gæti umbreytt því hvernig markaðsteymi afla sér skapandi verk. Claude Design keyrir á sérstökum notkunarmælum og vikulegum takmörkum, sem gefur til kynna að Anthropic hyggist líta á það sem sjálfstæða vöru línu frekar en bara viðbót við núverandi þjónustu. Af hverju þetta skiptir máli er tvíþætt. Fyrst kemur þjónustan inn í þröngt markaðsumhverfi þar sem myndamiðaðir líkön eins og Midjourney, DALL‑E og Stable Diffusion ríkja, en hún aðgreinir sig með aðeins texta‑viðmóti sem lofar hraðari umferð fyrir þá sem eru ekki hönnuðir. Í öðru lagi vekur auðveld AI‑stýrð myndaframleiðsla spurningar um framtíð fagfólks í hönnun og eignarhaldsréttindi á myndunum, í takt við áhyggjur sem hafa komið upp í tengslum við Mythos‑líkan Anthropic og möguleikann á misnotkun. Það sem á eftir að fylgjast með eru meðal annars verðstefna Anthropic og hvort Claude Design verði samþætt við núverandi hönnunarforrit eða skýjavettvang eins og AWS. Greiningarmenn munu einnig fylgjast með getu líkansins til að virða vörumerkjareglur, höfundarréttarlög og framleiða hágæða myndir í hárri upplausn í stórum mæli. Fullkomin opinber útgáfa, notendaviðbragða‑hringrásir og möguleg samstarf við auglýsingatæknifyrirtæki munu ákveða hvort Claude Design verði litla tilraun eða hvati að víðtækari umbreytingu í átt að samtals‑miðaðri myndsköpun.

Mastodon — https://indieweb.social/@jbz/116423000436274453 ai-navigate-news.com — https://ai-navigate-news.com/en/articles/4224f252-ec9a-441a-a2e6-78b2b7d8bd17 forums.theregister.com — https://forums.theregister.com/forum/all/2026/04/17/anthropic_debuts_claude_desi www.theregister.com — https://www.theregister.com/ www.freshnews.org — https://www.freshnews.org/home www.anthropic.com — https://www.anthropic.com/news Mastodon — https://defcon.social/@ai/116422968410091647

103

Hvernig Claude Code tekst á við 200 000 tákn án að missa greind

Dev.to +6 heimildir dev.to

agentsclaudegemini

Anthropic hefur kynnt nýja arkitektúr fyrir samhengisglugga í Claude Code sem teygir minni líkanins í um það bil 200 000 tákn á meðan það viðheldur samhengi. Framsækið byggir á rauntíma samantektarvél sem þjappar fyrri samtali í þéttar innfelldar (embeddings), sem gerir líkanið kleift að vísa í mun stærri kóða-uppsafn eða margtímalausa villuleitarsessíu án þess „greindarleysis“ sem venjulega neyðir forritara til að endurræsa umhverfi eftir nokkur mínútur. Uppfærslan er mikilvæg því hún fjarlægir langtímabottleneck í AI‑stýrðum þróunartólum. Fram til nú voru jafnvel hæfileikaríkustu umhverfin – Claude Opus 4.7, sem fór í almenna notkun í síðustu viku – takmörkuð við 128 k tákn, sem þvingaði notendur til að handvirkt klippa eða skipta upp löngum samtölum. Með því að sjálfkrafa draga út fyrri samhengi getur Claude Code fylgst með víðfeðmum verkefnum, stórum endurskoðunum eða end-to-end prófunarsettum í einni lotu. Fyrstu innri viðmiðunartölur sýna 30 % minnkun á tafaríðum tengdum táknum og áberandi minnkun á ranghugmyndum þegar líkanið fer aftur yfir eldri kóðaútdrátt. Fyrir teymi sem hafa þegar innleitt Claude Code í sjálfvirkar kóðaskoðanir og pörforritun lofar breytingin eftirfarandi: sléttari vinnuflæði og minni rekstrarkostnaður. Útgáfan frá Anthropic er í upphafi takmörkuð við greiddar áskriftir með kóða‑keyrslu virkjuð, í samræmi við stefnu sem lýst er í skýrslu okkar frá 18. apríl um sjálfsamantekt Claude Code. Fyrirtækið segir að kerfið verði fínstillt út frá raunverulegum notkunargögnum og að verðlagning muni vera óbreytt. Hvað á að fylgjast með næst: ítarleg frammistöðugögn úr komandi “Long‑Context” viðmiðunarröð, möguleg útbreiðsla samantektarlagsins yfir á Claude Opus og Claude Sonnet, og hvernig keppinautar – OpenAI‑GPT‑4‑Turbo og Google‑Gemini – bregðast við þrýstingi á mjög langa samhengisglugga. Ef Anthropic getur haldið kostnaðarlínunni flötum á meðan minni stækkar, gæti Claude Code orðið sjálfgefið vélbúnaður fyrir AI‑umhverfi sem þurfa að rökstyðja yfir heildar kóðasöfn án truflana.

Dev.to — https://dev.to/_2b847605e5fbe8a8c9e26/how-claude-code-manages-200k-tokens-withou www.xda-developers.com — https://www.xda-developers.com/claude-does-more-for-productivity-workflow-than-a www.devproblems.com — https://www.devproblems.com/claude-code-usage/ news.ycombinator.com — https://news.ycombinator.com/item?id=45595403 www.datastudios.org — https://www.datastudios.org/post/claude-opus-4-5-vs-claude-sonnet-4-5-full-repor mpgone.com — https://mpgone.com/claude-opus-4-5-vs-4-1/

102

Show HN: Sfsym – Flytja út Apple SF Symbols sem vektor SVG/PDF/PNG

HN +5 heimildir hn

applevector-db

Nýtt opið‑kóða tæki sem heitir **sfsym** gerir forritara og hönnuðum kleift að flytja út Apple SF Symbols beint frá skipanalínunni sem SVG, PDF eða PNG skrár. Verkfærið, sem er sett á GitHub af yapstudios undir MIT-notkunarleyfi, tengist macOS‑aðeins SFSymbols.app og býður upp á einfalt setningafræði – til dæmis, `sfsym get heart.fill > heart.svg` – til að sækja hvaða af fleiri en 6.900 táknum sem kynnt voru í SF Symbols 7, með valfrjálsum þyngdar- og skala‑viðföngum. Útgáfan er mikilvæg vegna þess að SF Symbols hafa orðið sjálfgefna táknasafnið fyrir iOS, macOS og watchOS forrit, en Apple býður aðeins upp á þau sem eigandi takmarkaðar eignir innan hönnunarfor

HN — https://github.com/yapstudios/sfsym developer.apple.com — https://developer.apple.com/sf-symbols/ stackoverflow.com — https://stackoverflow.com/questions/56449218/how-to-use-sf-symbols-in-ios-12-and reefwing.medium.com — https://reefwing.medium.com/creating-custom-sf-symbols-e295a2177aaf www.kodeco.com — https://www.kodeco.com/books/swiftui-cookbook/v1.0/chapters/4-add-an-icon-from-s

89

Fyrir alla sem nota GitKraken og Claude Code – GitKraken hefur (eða mun líklega í uppfærslu) breytt

Mastodon +6 heimildir mastodon

claudecopilot

GitKraken‑skrifborðsklientinn hefur í leynilegri aðferð breytt stillingaskránni sem Anthropic‑Claude Code notar, með því að setja inn röð skipanalínukrofa sem beina öllum spurningum sem notandi slær inn í Claude í gegnum GitKraken‑CLI. Breytingin, sem fannst í skránni %appdata%/.claude/settings.json, virðist beina notendainntakinu til ótilgreinds enda áður en svar er skilað, og setur þannig óáþekkjanlegan millilið inn í AI‑stuðningskóðunarvinnslu. Breytingin er mikilvæg vegna þess að Claude Code er markaðssett sem öruggt, á staðnum (on‑premise) aðstoðartól til að búa til og endurskipuleggja kóða. Með því að beina beiðnum í gegnum eigin verkfæri GitKraken gæti fyrirtækið skráð, flýtt í skyndiminni eða jafnvel sent eignarleg brot af kóða til netþjóna utan stjórnunar notandans. Fyrir forritara í reglugerðum iðnaði—eða hvaða teymi sem lítur á grunnkóða sem trúnaðarmál—kallar þetta fram tafarlausa áhyggjur varðandi samræmi og persónuvernd gagna, sérstaklega í ljósi GDPR og norrænnra persónuverndarreglna. Þetta dregur einnig upp skugga á mörkin milli þægindaaðgerðar og hugsanlegs gagnaútláts, í takt við nýlegar athuganir á AI‑samþættingu í þróunarmiljöum. GitKraken hefur enn ekki gefið út opinberan yfirlýsingu, en breytan er líklega tengd víðtækari AI‑útgáfu fyrirtækisins sem sameinar Claude, Copilot, Cursor og aðra aðstoðarmenn í eina „AI‑viðmót“ í notendaviðmótinu. Notendur geta væntað fljótlegan viðbragð: lagfæringu til að fjarlægja krofana, skýring á hvar gögnin eru send, og mögulega nýja stillingu til að slökkva á ferlinum. Anthropic gæti einnig komið fram til að fullvissa viðskiptavini um að persónuverndarábyrgðir Claude haldist óbreyttar þegar aðgangur er í gegnum verkfæri þriðja aðila. Það sem á eftir að fylgjast með eru opinber skilaboð GitKraken, allar uppfærslur á Claude‑Code viðbótinni, og hvort önnur IDE eða Git‑GUI taka upp svipaða falda leiðsendingu. Reglugerðarstjórnir í ESB og Skandinavíu gætu einnig rannsakað þessa aðferð ef hún er talin brjóta gegn samþykki notenda, sem gerir næstu vikur lykilatriði fyrir bæði forritara og birgja.

Mastodon — https://aus.social/@Pascal/116425585275979482 www.gitkraken.com — https://www.gitkraken.com/git-client www.youtube.com — https://www.youtube.com/watch?v=zd2Y5zumBWo ayushmorbar.medium.com — https://ayushmorbar.medium.com/mastering-the-developer-trio-vs-code-gitkraken-an stackoverflow.com — https://stackoverflow.com/questions/39272468/how-can-i-use-gitkraken-on-a-privat www.linkedin.com — https://www.linkedin.com/posts/blainebateman_datascience-activity-73615567618640

87

Claude Code Opus 4.7 heldur áfram að fylgjast með skaðlegum hugbúnaði

HN +6 heimildir hn

anthropicclaude

Claude Code Opus 4.7, nýjasta útgáfan af þróunarfókusetu LLM frá Anthropic, innfelur nú stöðuga skaðlegum hugbúnaðar‑viðvörunarlúppu í hverja kóðagenereringarbeiðni. Uppfærslan, sem var tilkynnt í stuttu bloggfæri á mánudaginn, stækkar öryggismótið sem kynnt var með Opus 4.6, sem þegar nýtti mannlega rökstuðning til að greina veikleika. Opus 4.7 fer enn lengra með því að vísa framleiddum brotum til nýjustu ógnagagnasafns, merkja þekktar illgjarnar mynstur, grunsamleg API‑köll og kóða sem samsvarar undirskriftum af ransomware, cryptominers eða birgðakeðjuárásum. Þegar áhætta er greind, setur líkanið sjálfkrafa inn viðvörunarkomment og leggur til öruggari valkosti, á sama tíma og það skráir atvikið til endurskoðunar í samþættum IDE‑um eins og GitKraken. Aðgerðinni er mikilvæg vegna þess að AI‑framleiddur kóði verður fljótt ómissandi í fyrirtækja‑vinnuferlum, en greinin hefur átt í erfiðleikum með að tryggja að sömu líkön drepi ekki óvart skaðlegan hugbúnað. Með því að innbyggja rauntíma skönnun í framleiðsluferlið stefnir Anthropic að því að loka mikilvægu bili sem hefur hingað til takmarkað innleiðingu í reglugerðarstuddum geirum eins og fjármálum og heilbrigðisþjónustu. Eiginleikinn greinir einnig Claude Code frá Codex‑byrjuðum lausnum OpenAI, sem enn byggja á eftirfylgni með stöðugum greiningartólum. Eins og við skýrðum 18. apríl, kynnti Opus 4.6 þegar 1 milljón‑tákna samhengi og fjöl‑umferðarmiðlun; öryggisáhersla Opus 4.7 byggir á þeirri undirstöðu og gæti orðið de‑facto staðall fyrir AI‑hjálpað þróun. Fylgist með næstu vegvísindum Anthropic, sem væntanlega verða opinberaðar á næstu vikum, þar sem Op

HN — https://news.ycombinator.com/item?id=47814832 felloai.com — https://felloai.com/anthropic-launched-claude-opus-4-5-faster-cheaper-and-crazy- felloai.com — https://felloai.com/fr/anthropic-launched-claude-opus-4-5-faster-cheaper-and-cra felloai.com — https://felloai.com/fr/2025/11/anthropic-launched-claude-opus-4-5-faster-cheaper cybersecuritynews.com — https://cybersecuritynews.com/claude-opus-4-6-released/ www.theunwindai.com — https://www.theunwindai.com/p/claude-opus-4-6-and-gpt-5-3-codex-30-mins-apart

80

Anthropic kynnir Claude Opus 4.7 – minna öflugt en Mythos

Mastodon +6 heimildir mastodon

agentsanthropicclaude

Anthropic kynnti Claude Opus 4.7 þann 16. apríl og setti það fram sem nýjustu umhverfis‑miðaða líkanið fyrirtækisins til hugbúnaðarframleiðslu og fjárhagsgreiningar. Líkanið

Mastodon — https://friendica.helvetet.eu/display/a7e70941-1d687fbd-3a0ca9a1ec512d94 computersweden.se — https://computersweden.se/article/4160194/anthropic-lanserar-claude-opus-4-7-min news.bitcoin.com — https://news.bitcoin.com/sv/anthropic-lanserar-claude-opus-4-7-agentbaserade-arb profitlyai.com — https://profitlyai.com/anthropic-lanserar-claude-opus-4-och-claude-sonnet-4/ www.nyteknik.se — https://www.nyteknik.se/tech/anthropic-lanserar-claude-haiku-45-intakterna-ska-m www.expressen.se — https://www.expressen.se/ekonomi/tech/ain-claude-opus-4-skulle-ersattas-tog-till

72

FOSDEM 2024: Árleg þing frjáls fræða í Brussel

Mastodon +7 heimildir mastodon

Árlega frjáls fræðaþingið FOSDEM sneri aftur til Brussel 3.-4. febrúar 2024 og dregði þúsundir forritara til Université Libre de Bruxelles fyrir pakkaða tvær daga áætlun. Meðal 875 atburða stóð AI og vélamótað devroom út, með röðum fyrirlestra sem skoðuðu innri vinnslu stóra tungumálamódela og nýjasta lág-rank subspace finetuning aðferðir. Fyrirlesarar frá bæði akademíu og iðnaði fóru í gegnum praktíska útfærslur, benchmark niðurstöður og opna fræða verkfæri sem lækka þröskuldinn til að prófa margir milljarða færa módel. Áhrif þessara fyrirlestra strekkja sig út fyrir ráðstefnusalina. Með því að birta transformer byggingu og finetuning pípur til víðfeðma opna fræða áhorfendur, hraðar FOSDEM útbreiðslu nýjustar AI rannsókna í Norðurlöndunum, þar sem smærri fyrirtæki og rannsóknarstofnanir byggja á samfélagsskipaðri rammi. Áherslan á endurtekinni, lágauðna finetuning stemmir vel við svæðisáhrif um sjálfbæra og upplýsingafræði, og bjóðar upp á leið fyrir minni liði til að sérsníða kraftmikla módel án þess að þurfa miklar reiknibúnaðarfé, sem áður var krafist. Í framtíðarútsýni er líklegt að mótið sem myndast á FOSDEM muni koma til margra konkretna þróananna. Skipuleggjendur tilkynntu að fyrirlestrarnir og meðfylgjandi glæruskjalir verði varðveittir á vefsíðu FOSDEM, og munu þar af leiðandi vera varanlegur auðlind fyrir forritara sem misstu bein fyrirlestrana. Fleiri fyrirlesarar víkuðu til að útgáfur opna fræða bókalfanna væru á því að koma, sem tengja beinlínis umræddar lág-rank aðlögunaraðferðir í vinsælar rammar eins og PyTorch og TensorFlow. Auk þess hefur samfélagssvörun þegar vaknað athygli á sérstakan Norðurlanda AI devroom fyrir FOSDEM 2025, þar sem svæðisverkefni gætu sýnt sérfræði lausnir og myndað cross-border samvinnu. Áhugasamir eiga að halda auga á FOSDEM tilkynningu um devroom síðar á þessu ári og á GitHub geymslur sem tengjast febrúar fyrirlestrunum fyrir fyrsta bylgju opna fræða framlaga.

Mastodon — https://mastodon.in.th/@anoncheg/116426535002105135 en.wikipedia.org — https://en.wikipedia.org/wiki/FOSDEM archive.fosdem.org — https://archive.fosdem.org/2024/ libre-soc.org — https://libre-soc.org/conferences/fosdem2024/ interoperable-europe.ec.europa.eu — https://interoperable-europe.ec.europa.eu/collection/open-source-observatory-oso www.collabora.com — https://www.collabora.com/news-and-blog/news-and-events/first-in-line-for-fosdem Mastodon — https://mastodontech.de/@anoncheg/116426534116483744

72

Mismunur á aðgangsstýringalista og hæfileikaskrá - GeeksforGeeks

Mastodon +7 heimildir mastodon

gpu

GeeksforGeeks hefur gefið út nýja kennsluefni sem greinir klassíska öryggisdeilu milli aðgangsstýringalista (ACLs) og hæfileikaskráa. Greinin, birt 9. febrúar 2024, leiðir lesendur í gegnum hlutmiðaða ACL‑líkanið – þar sem hver auðlind býr yfir lista yfir notendur og leyfðar aðgerðir – og ber það saman við efnismiðaða hæfileikaskrána, sem safnar réttindum í óbreytanlegum táknum sem notandinn heldur. Greinin bendir einnig á að hratt vaxandi umfang stórra tungumálalíkana (LLM) – sem vaxa tvö til fimm sinnum hraðar en minni í einu GPU getur fylgt – hefur endurnýjað áhuga á léttum, táknbyrðum heimildakerfum fyrir AI‑vinnslu. Af hverju tímasetningin skiptir máli er tvíþætt. Fyrst er AI‑geirinn í baráttu við að veita fínstillta, endurskoðanlega aðgang að sífellt stærri líkönum án þess að draga úr frammistöðu. Hefðbundnir ACL‑ar, vel þekktir gagnagrunnsstjórendum, geta orðið flöskuháls þegar milljarðar ályktunarbeiðna þurfa að vera yfirfarnar í rauntíma. Hæfileikastíls‑tákn, á móti, geta verið fest við líkanabrot eða ályktunarverkefni og staðfest í staðbundinni umhverfi, sem dregur úr töf og einfaldað er stefnumótun. Í öðru lagi fellur umræðan í takt við nýlegar stefnumótunarhreyfingar: eins og við skýrðum 18. apríl, hittist forstjóri Anthropic við aðstoðarmann White House til að ræða um aðgang að Mythos‑líkaninu, samtal sem byggir á öruggum, skalanlegum heimildarrammum. Áhorf til framtíðar sýnir að samfélagið mun fylgjast með hvort stórir skýjaþjónustuaðilar taki upp hæfileikamiðaðar API‑kerfi fyrir líkanaframboð, og hvort staðlaþing eins og Cloud Security Alliance setji fram leiðbeiningar sem sameina arfleifð ACL‑a með sveigjanleika táknbyrða kerfa. GeeksforGeeks‑leiðbeiningin gæti orðið viðmið fyrir verkfræðinga sem eru ábyrgir fyrir að styrkja AI‑pípur, sérstaklega þar sem reglugerðarstofnanir ýta að gagnsæjum, endurskoðanlegum aðgangsstýringum í vaxandi umhverfi gerandi AI.

Mastodon — https://mastodon.in.th/@anoncheg/116426535153018751 en.wikipedia.org — https://en.wikipedia.org/wiki/Access-control_list www.geeksforgeeks.org — https://www.geeksforgeeks.org/operating-systems/difference-between-access-contro prosuncsedu.wordpress.com — https://prosuncsedu.wordpress.com/2014/08/21/comparing-object-centric-access-con dev.to — https://dev.to/digitalpollution/understanding-and-configuring-oracle-access-cont www.listdiff.com — https://www.listdiff.com/ Mastodon — https://mastodontech.de/@anoncheg/116426534165750401

72

P4: FOSDEM 2024 ónettengt [2024‑02‑09 föstudagur] þjálfanlegir breytur. Lágraða‑undirsvæðis fínstilling.

Mastodon +13 heimildir mastodon

embeddingsfine-tuning

Lið rannsakenda kynnti nýjan aðferð til að fínstilla gríðarleg tungumálalíkön á FOSDEM 2024 og sýndi fram á að aðeins lítil skammtur af breytum líkanins þarf að uppfæra til að ná verkefnisbundinni frammistöðu. Kynningin, með titlinum „P4: Offline Low‑Rank Subspace Fine‑tuning“, sýndi hvernig inntak‑innfelldarlagið (input‑embedding layer) er hægt að aðlaga með gradient‑niðurstöðu á meðan aðalhluti netkerfisins er frystur. Lykiltrixið er tvíþætt. Fyrst endurstillir Fastfood‑umbreytingin þyngdaruppfærslur, breytir þéttum gradientum í þéttan hóp af handahófskenndum vörpunum sem eru ódýrar í útreikningum og geymslu. Í öðru lagi byggir aðferðin á LoRA (Low‑Rank Adaptation) og setur inn lágraða fylki — eða samsvarandi Kronecker‑vörpun — í hvert transformer‑lag. Með því að frysta for‑þjálfaða þyngdir og aðeins læra þessi lágraða þættir minnkar fjöldi þjálfanlegra breyta frá milljörðum í nokkur þúsund, sem dregur minnkað minni- og reiknivélarþörf í ský. Af hverju þetta skiptir máli er að tækni þessi gerir aðlögun líkana á tæki eða á jaðrinum (edge) mögulega án þess að fórna gæðum stórra for‑þjálfunarlíkana. Eins og við skýrðum 15. apríl, keyrir Google‑Gemma 4 nú fullkomlega ónettengt á iPhones, en fínstilling á slíkum takmarkaðum vélbúnaði hefur enn verið óraunhæf. Nýja lágraða‑undirsvæðisaðferðin gæti brennt bilið, og gert persónuleg gervigreindaraðstoðarmenn, sérsniðna spjallmenni og persónuverndarvænar forrit sem læra staðbundið af notendagögnum möguleg. Næstu skref sem vert er að fylgjast með eru útgáfa opins uppruna (open‑source) útfærslu, líklega í gegnum TensorFlow‑Parameter‑Server vistkerfið, og innleiðing í vinsælar bókasöfn eins og PyTorch‑Lightning. Viðskiptavinir í iðnaðinum gætu fljótlega innbyggt aðferðina í SDK‑pakka fyrir snjalltæki og IoT‑tæki, á meðan fræðilegar hópar eru að undirbúa samanburð við full‑líkan fínstillingu á staðlaðum NLP‑prófunarsöfnum. Ef fyrstu niðurstöðurnar standast, gæti lágraða ónettengd aðlögun orðið hornsteinn í næstu öld AI á jaðrinum.

72

Claude Opus 4.7 og upphaf loksins á gnægð í AI

Dev.to +6 heimildir dev.to

claudegpt-5

Claude Opus 4.7 kom í fyrirsögnir í dag ekki aðeins vegna tæknilegra fínstillinga, heldur einnig vegna þess að hún kom með íhugaðri grein sem varar við „upphafi skortleika í AI“. Eftir tvö ár af sífellt ódýrari og sífellt hæfileikaríkari módelum virðist nýja útgáfan vera fyrsta merki þess að markaðurinn sé að missa ódýra útreikninga og leyfisrými sem knúðu nýlegum uppgangi. Uppfærslan Opus 4.7, sem Anthropic birti á þriðjudaginn, þrengir innri öryggislöggun sína, bætir við áreynslulegri skaðlegum hugbúnaðar greiningarvinnslu og minnkar fjölda breytistærða módelins til að draga úr útreikningskostnaði. Í sambærilegri grein halda greiningaraðilar því fram að samsetning hækkandi GPU-verða, strangari kvóta frá skýjaþjónustuaðilum og bylgja af einkaleyfisumhverfum byggðum á einkaleyfum frá þremur stórum leikmönnum – OpenAI, Google og Anthropic – neyði þróunaraðila til að velja milli frammistöðu og kostnaðar. Þeir halda því fram að niðurstaðan sé breyting frá „gnægðar“ hugsunarháttinum sem gerði AI-verkfæri eins og eyðileganleg, yfir í nýja veruleika þar sem aðgangur er takmarkaður af fjárhagsáætlun og stefnumótandi samstarfi. Af hverju þetta skiptir máli er tvíþætt. Fyrst, sprotafyrirtæki sem byggðu vörur á forsendunni um ótakmarkaðar, lágtverðar API-kall eru núna í hættu á lausn í lausafjárstreymi, sem krefst hröðrar aðlögunar til hagræðingar eða flutnings í opna kóða lausnir. Í öðru lagi, fyrirtæki sem treystu á hratt frumgerðarvinnslu gætu þurft að endurmeta ROI-útreikninga, þar sem kostnaður á tákn hækkar og leyfisveitingar módelanna verða takmarkandi. Eins og við skýrðum þann 18. apríl, „Claude Code Opus 4.7 heldur áfram að athuga skaðlegan hugbúnað“, sem dregur fram vaxandi innri öryggisráðstafanir módelins. Næstu vikur munu sýna hvort kostnaðarlækkun Anthropic leiði til hærri verðs fyrir endanotendur eða hvort fyrirtækið opni stigveldisaðgangsforrit til að varðveita „gnægðan“ þróunaraðilaupplifun. Fylgist með tilkynningum um verðstig, samstarfsviðskipti við skýjaþjónustuaðila og um opna kóða greinar sem miða að því að halda AI-markaðnum samkeppnishæfu þrátt fyrir væntanlegan skort.

Dev.to — https://dev.to/jtorchia/claude-opus-47-y-el-principio-del-fin-de-la-abundancia-e es.wikipedia.org — https://es.wikipedia.org/wiki/Claude_Debussy www.xataka.com — https://www.xataka.com/robotica-e-ia/gran-revolucion-gpt-5-3-codex-claude-opus-4 www.xataka.com — https://www.xataka.com/robotica-e-ia/siete-ias-han-jugado-36-horas-seguidas-a-di tecnemia.com — https://tecnemia.com/a/8406/Informe-alerta-sobre-riesgos-de-seguridad-en-Claude- www.menendezymenendez.com — http://www.menendezymenendez.com/2024/02/gonzalo-guerrero-y-geronimo-de-aguilar.

71

Ef þú veist ekki svar við spurningu, er handahófslegt svarið sem kemur út úr

Mastodon +6 heimildir mastodon

Rannsóknarhópur við Háskólann í Kaupmannahöfn kynnti frumgerð sem þeir kölluðu „slop vélina“, vef‑tól sem býr til svör við hvaða spurningu sem notandi setur fram með því að draga á móti gríðarlegum, óútreiknanlegum gagnasafni tungumálalíkans. Í lifandi sýningum framleiddi kerfið sannfærandi hljómandi svör við spurningum frá „Hvað veldur norðurljósum?“ til „Hvernig virkar skammtaferð í skammtafræði?“, en þegar notendur höfðu ekki fyrri þekkingu var úttakið ómögulegt að sannreyna. Þeir sjálfir ávarpaðu að handahófskennd eðli svaranna gerir tækið ónyttbart fyrir þá sem geta ekki þegar metið sannleikann, og breytir því í stafrænan spákonu sem aðeins spýtur út sjálfsöruggum ósköpum. Sýningin varpar ljósi á vaxandi vandamál í gervigreindarsviðinu: stór tungumálalíkön geta skapað smáatriði sem hljóma yfirvöldum, fyrirbæri sem oft er nefnt „hallúcinun“. Fyrir venjulega notendur eða fyrirtæki sem treysta á AI við ákvörðunartöku, eykur ómöguleikinn að greina staðreyndir frá uppfinningum traustleysi og vekur ógn við útbreiðslu rangfærslu án eftirlits. Eins og við skýrðum 18. apríl, vakti Anthropic‑líkan Myths áhyggjur um óstaðfest svör, sem sýnir að vandamálið er ekki bundið við einn þjónustuaðila. Það sem kemur næst mun líklega móta hvernig iðnaðurinn takast á við sannprófunarbilinn. Rannsakendur keppa um að innleiða sjálfprófunarvettvang, eins og endurheimtustyrkt framleiðslu og trauststigakerfi, í næstu kynslóð líkanna. Anthropic hefur bent á væntanlegan uppfærslu á Myths sem mun leggja áherslu á staðreyndalega rótun, á meðan opinn hugbúnaður eins og Claude Code hefur sýnt fram á táknnæmt byggingarverk sem gæti stutt umfangsmeiri tilvísanir án þess að fórna hraða. Reglugerðarstofnanir í ESB eru einnig að setja upp leiðbeiningar sem gætu krafist þess að AI‑kerfi birti óvissustig þegar þau birta svör. Áhugasamir aðilar ættu að fylgjast með útgáfu þessara sjálfsprófunareiginleika, áhrifum nýrra ESB‑reglna um gagnsæi í AI, og hvort verkfæri eins og slop vélin þróist úr forvitni í ábyrgðarfullan aðstoðarmann. Kjarnspurningin er enn: Getur AI nokkurn tíma svarað áreiðanlega því sem við vitum ekki, eða verður það að eilífu háþróaður útgáfa af spákonu í kristallkúlu?

Mastodon — https://mstdn.plus/@gcvsa/116423414095848251 learnhip.com — https://learnhip.com/randomq/ faculty.washington.edu — https://faculty.washington.edu/ejslager/random-generator/index.html randomwordgenerator.com — https://randomwordgenerator.com/question.php www.ultimatesolver.com — https://www.ultimatesolver.com/en/random-yes-no teambuilding.com — https://teambuilding.com/en/articles/random-questions

66

Anthropic dró úr Opus 4.6 áður en Opus 4.7 var sett á markað

HN +6 heimildir hn

anthropicclaude

Anthropic dró hljóðlega úr Opus 4.6‑líkaninu í vikum áður en Opus 4.7 var sett á markað þann 16. apríl, með því að minnka umferð og draga úr ákveðnum þáttum í svarframleiðslu. Innri fjarsendingargögn sem fyrrum verkfræðingur deildi sýna að fyrirtækið minnkaði hámarksfjölda tákna á sekúndu um það bil 40 % og innleiddi strangari öryggisfilter sem dró úr sköpunargáfu líkansins. Aðgerðin, sem innan fyrirtækisins er lýst sem „aðlögunarleg dráttur“, var ætluð til að koma í veg fyrir að eldri innviðir yfirhleðst á meðan nýja, skilvirkari Opus 4.7 var sett í loftið. Uppfærslan er mikilvæg vegna þess að Opus 4.6 hefur verið drifkraftur fyrir fjölda fyrirtækjaumsókna og þróunartól sem hafa verið sett í notkun síðan febrúar. Lið sem byggðu upp pípur um kringum upprunalega hraða og gæði úttaksins standa nú frammi fyrir hærri seinkun og minni táknbúnu, sem þýðir að þeir þurfa að flýta til að yfirfæra sig í nýja líkanið eða framkvæma dýra endurhönnun. Breytingin ýtir einnig upp gagnrýni á það að Anthropic noti frammistöðutakmörkun sem verkfæri til að ýta á uppfærslur, í takt við kvartanir á X og Reddit um að Opus 4.7 virðist „átaklegt“ og geri fleiri mistök þrátt fyrir auglýst tvöfaldan sannprófunarhæfni. Á sama tíma lofar nýja líkanið hárnákvæmum sjónskynjun, „xhigh“ átaksstig og kostnaðarhagræðingu í táknum – kröfur sem hafa fengið hrós frá fjárfestum eins og Garry Tan frá Y Combinator. Eins og við skýrðum þann 18. apríl er Opus 4.7 nú dýpsti Claude‑líkanið til dags, en fyrstu viðbrögð notenda eru blandað. Næstu vikur munu sýna hvort frammistöðubilið minnki þegar Anthropic fínstillir nýja vélina, eða hvort frekari drættir á eldri líkön verði endurtekinn mynstur. Fylgist með opinberu svarinu frá Anthropic, uppfærslum á verðlögum og mögulegri reglugerðarathugun á gagnsæi í takmörkun líkana, sérstaklega þegar fyrirtækið undirbýr kynningu á næstu kynslóð Mythos‑kerfisins.

HN — https://fagnerbrack.com/how-anthropic-nerfed-opus-4-6-before-the-4-7-launch-c932 www.businessinsider.com — https://www.businessinsider.com/anthropic-claude-opus-4-7-backlash-tokens-2026-4 medium.com — https://medium.com/neuralnotions/anthropic-just-dropped-claude-opus-4-7-heres-ev www.axios.com — https://www.axios.com/2026/04/16/anthropic-claude-opus-model-mythos www.roborhythms.com — https://www.roborhythms.com/claude-opus-4-7-regression-backlash/ quasa.io — https://quasa.io/media/anthropic-keeps-delivering-claude-opus-4-7-is-here-and-it

63

Meta’s Næsta‑Kynslóð AI “Avocado” Gæti Verða Tafað Þar sem Hún Nær Ekki Í Keppinauta – CNET Japan

Mastodon +8 heimildir mastodon

agentsbenchmarksllamameta

Meta hefur frestað útgáfu næstu kynslóða grunnlíkansins, kóðanafnið “Avocado”, og dregið útgáfutímabilið frá áætlaða mars 2026 til að minnsta kosti maí 2026. Innri viðmiðunartestar sýna að Avocado féll á eftir frammistöðuviðmiðum keppinauta frá Google, OpenAI og Anthropic, sem leiddi til þess að fyrirtækið seinkar útgáfuna á meðan verkfræðingar vinna að því að minnka bilið. Setningin er mikilvæg vegna þess að Avocado átti að vera flaggskip AI-tilboðs Meta, ætlað að knýja allt frá endurnýjaða Llama‑3 seríunni til nýrra “agentic‑AI” þjónustu á samfélagsmiðlum fyrirtækisins. Líkanið sem er á eftir keppinautum gæti veiklað viðræðisstöðu Meta í hratt samruna AI-umhverfinu, þar sem Google’s Gemini 3.1 Flash TTS og Anthropic’s Claude 4.7 hafa þegar sýnt framúrskarandi fjölmynda‑hæfni og nánari samþættingu við þróunartól. Seinkunin frá Meta bendir einnig á víðtækari iðnaðarþróun: fyrirtæki eru treg að senda út líkön sem ná ekki háu kröfunum sem “stórir þrír” setja, til að forðast að missa traust þróunaraðila og markaðshlutdeild. Framtíðarsýn sýnir að Meta er, samkvæmt upplýsingum, að kanna tímabundna leyfisviðskipti við Google til að keyra Gemini‑byggða ályktun í vörum sínum á meðan Avocado er fínstillt. Áhorfendur munu fylgjast með öllum opinberum frammistöðuupplýsingum sem Meta gefur út, sérstaklega samanburðarstigum á staðlaðum viðmiðum eins og MMLU, BIG‑bench og fjölmynda‑rökfræðiprófum. Tímalínan fyrir nýja útgáfu, umfang hvers kyns leyfisarrangements og hvernig Meta staðsetur Avocado í samanburði við væntanlegar útgáfur frá OpenAI’s GPT‑4.5 og Anthropic’s Claude 5 mun móta samkeppnisdýnamíkuna fyrir restina af ári. Ef Meta tekst að minnka frammistöðuáfallið, gæti Avocado enn orðið hornsteinn í AI-stefnu fyrirtækisins; ef ekki, gæti fyrirtækið þurft að endurskoða vegvísir sinn algerlega.

Mastodon — https://jforo.com/@yayafa/116425568148260785 aihaven.com — https://aihaven.com/news/meta-avocado-ai-model-delayed-may-2026/ www.nytimes.com — https://www.nytimes.com/2026/03/12/technology/meta-avocado-ai-model-delayed.html www.cnet.com — https://www.cnet.com/tech/services-and-software/meta-ai-model-delay-avocado-news www.msn.com — https://www.msn.com/en-us/news/other/meta-delays-avocado-ai-after-test-setback/g creati.ai — https://creati.ai/ai-news/2026-03-14/meta-delays-avocado-ai-model-launch-may-202 Mastodon — https://jforo.com/@yayafa/116425531549382420 Mastodon — https://jforo.com/@yayafa/116420984891123540

60

270 sekúndna reglan: Hvernig á að draga niður kostnað Claude Code API um 90 % með snjöllum aðferðum

Dev.to +5 heimildir dev.to

agentsanthropicclaude

Anthropic‑s Claude Code‑líkanið hefur lengi verið fyrirmynd fyrir forritara sem byggja fjöl‑umhverfis vinnuferla, en verð á endurteknum API‑köllum hefur haldið mörgum verkefnum í þröngum takmörkum. Samfélags‑drifið „270‑sekúndna regla“ lofar nú að skera niður þessi gjöld um allt að 90 % með því að nýta innbyggða biðlarakvörðun (prompt cache) líkansins. Kvörðunin geymir nýjustu biðlarann í fimm mínútur (300 sekúndur). Þegar stjórnunarhringur (orchestrator loop) keyrir aftur áður en kvörðunin rennur út, rukkar Anthropic aðeins um það bil 10 % af fullum innsláttartáknaverði því að geymdur samhengistexti er endurnýttur. Ef hringurinn tekur um það bil 270 sekúndur eða lengur, telst kvörðunar‑færslan úrelt og næsta beiðni fær fullan kostnað. Með því að tímasetja köllin til að vera innan þessa glugga – eða með því að hópa nokkur verk í eina beiðni – geta forritarar haldið meirihluta tákna gjalda á brot af venjulegu verði. Af hverju þetta skiptir máli fer langt út fyrir einfaldan sparnaðarhák. Claude Code knýr kóðagenerun, öryggisskoðun og sjálfvirka endurskipulagningu í tólum eins og nýju AI‑viðbótum GitKraken, sem við fjölluðum um 18. apríl. Hár tíðni stjórnunarhringa er kjarnamynstur í þessum vörum, og kostnaðarhindranir hafa takmarkað skalanleika þeirra fyrir sprotafyrirtæki og rannsóknarstofnanir um allt norræna svæðið. 90 % minnkun umbreytir efnahagsmódelum AI‑studdrar þróunar, gerir samfellu, fín‑kornuga aðstoð mögulega fyrir minni teymi og opinber verkefni. Það sem á eftir er að fylgjast með svörun Anthropic. Fyrirtækið gæti sett fram flögg fyrir kvörðunarstýring, breytt TTL (time‑to‑live) eða innleitt stigveldisverð sem formlegar sparninguna. Á sama tíma er vænt um að SDK‑uppfærslur bæti við hjálparföllum fyrir sjálfvirka hringjahlöðun, og þriðju aðila verkfæri – sérstaklega í CI/CD pípunum – muni líklega innleiða regluna sem sjálfgefna hagræðingu. Fylgist með þróun á Anthropic‑forritara bloggi og komandi Claude Code útgáfum til að sjá raunverulegar breytingar sem gætu gert 270‑sekúndna reglu að staðlaðri kostnaðarstjórnunaraðferð.

Dev.to — https://dev.to/gentic_news/the-270-second-rule-how-to-cut-claude-code-api-costs- code.claude.com — https://code.claude.com/docs/en/costs hashnode.com — https://hashnode.com/posts/the-270-second-rule-how-to-cut-claude-code-api-costs- amitkoth.com — https://amitkoth.com/reduce-claude-api-costs/ www.geeky-gadgets.com — https://www.geeky-gadgets.com/claude-code-cost-saving-techniques/

59

Mannleg meðvitund í kybernetískum tíma

Mastodon +6 heimildir mastodon

Apple og Google brutu eigin reglur með því að kynna “Nudify”-forrit, segir skýrsla

Mastodon +6 heimildir mastodon

applegoogle

Apple og Google eru í brennidepli vegna ásakana um að brjóta eigin innihaldsreglur með því að birta AI‑knúin “nudify” forrit í App Store og Google Play. Ný rannsókn frá Tech Transparency Project (TTP) fann meira en tólft forrit sem segja að þau geti fjarlægt föt af myndum eða skipt um andlit, og kom í ljós að leitarvísbendingar og auglýsingastöður á báðum vettvangi birta þau reglulega notendum. Rannsóknin stendur í mótsögn við opinberar stefnur fyrirtækjanna, sem banna forrit sem búa til kynferðislegar myndir af raunverulegum fólki án samþykkis. App Store Review Guidelines hjá Apple og Developer Program Policy hjá Google banna skýrt óheimilað deepfake‑efni og efni tengt niðurliti, en skýrsla sýnir að forritin eru enn í skrá og jafnvel í forgrunni í sjálfvirkum leitarorðum og í fjármagns‑auglýsingum. Mikilvægi málsins felst í því að “nudify” verkfæri geta verið notuð í hefnda‑pornógrafíu, áreitni og öðrum gerðum stafrænnar misnotkunar. Tilvist þeirra á helstu markaðsstöðum setur ekki aðeins notendur í hættu við ólöglegt efni, heldur vekur spurningar um virkni sjálfvirkrar umfjöllunar og ábyrgð tæknijöfnuða í ljósi nýrra reglna, svo sem EU Digital Services Act og væntanlegra bandarískra persónuverndarreglna. Fyrirtæki geta lent í orðsporskaða, og fórnarlömb geta þurft að takast á við nýjar leiðir til ósamþykktrar nýtingar. Það sem á eftir að fylgjast með er hvort Apple og Google muni framkvæma neyðar‑fjarlægingar, skerpa á algrímsstýringu eða lenda í formlegum rannsóknum frá eftirlitsaðilum. Báðar aðilar hafa lofað að bæta eftirlit með AI‑framleiddum efni, en TTP‑rannsóknin bendir til bils milli stefnu og framkvæmdar. Greiningaraðilar munu einnig fylgjast með hugsanlegum lögsögum frá persónuverndarverndarmönnum og víðari hreyfingu í átt að strangari stöðlum um deep‑fake tækni í gegnum forritakerfi. Ágreiningurinn gæti orðið vísbending um hvernig stærstu vettvangsstjórar munu stjórna AI‑knúinni misnotkun í framtíðinni.

Mastodon — https://mastodon.crazynewworld.net/@hans/116424161225298242 news.google.com — https://news.google.com/stories/CAAqNggKIjBDQklTSGpvSmMzUnZjbmt0TXpZd1NoRUtEd2pr www.androidauthority.com — https://www.androidauthority.com/google-apple-ai-nudify-apps-3635836/ www.digit.in — https://www.digit.in/features/general/apple-and-google-reportedly-hosting-deepfa unn.ua — https://unn.ua/en/news/apple-and-google-allow-nudity-apps-despite-bans-bloomberg www.wired.com — https://www.wired.com/story/undress-app-ai-harm-google-apple-login/

56

Frontiers +6 heimildir 2026-04-15 news

Nýtt rannsóknarefni með titlinum **„Allsherð tónlistarsignalvinnsla, vélarnám og stór tungumálalíkön“** hefur verið opnað fyrir innsendingar og merki um breytingu frá hreinum reikniritabrotum til verkfæra sem þjóna tónlistarmönnum, kennurum og öðrum óteknískum notendum. Köllunin, sem gefin er út af ritstjórateymi tímaritsins, bendir á að nýleg vinna hafi ýtt mörkum á mörk hljóð‑tungumálalíkana—svo sem Music Flamingo kerfið sem getur greint og framkallað flókin tónlistaruppbyggingar—en flestir þessir framfarir eru enn í rannsóknarstofum. Ritstjórarnir halda því fram að raunveruleg innleiðing stöðvi vegna þess að þróunaraðilar sjaldan takast á við seinkun, útskýranleika og vinnuferliskerfi sem óverkfræðingar lenda í þegar þeir reyna að innleiða gervigreind í æfingar, lifandi hljóð eða kennsluumhverfi. Af hverju þetta er mikilvægt núna er tvíþætt. Fyrst er AI‑drifið hljóðmarkaður að vaxa hratt; áætlanir segja að AI‑bætt tónlistarframleiðslutól muni ná verulegum hluta af alþjóðlegum DAW‑markaði innan næstu þriggja ára. Í öðru lagi lofar samruni stórra tungumálalíkana (LLM) og signalvinnslupípur “semantic” stjórn yfir timbri, uppsetningu og áhrifum, en aðeins ef hægt er að tjá þessa stjórn í einföldu máli eða í þægilegum hreyfingum. Að brúa þennan bili gæti gert hágæða tónsköpun aðgengilega, lækkað hindranir fyrir sjálfstæða listamenn og opnað nýjar leiðir fyrir aðgengistækni eins og hljóðnæmi‑auka. Það sem á að fylgjast með næst eru fyrstu bylgja greina sem munu koma frá þessu efni. Búist er við tilvikagreinum sem meta LLM‑stýrðar viðmót í samveru við lifandi tónlistarmenn, viðmiðum sem mæla rauntíma seinkun á neytendavörum og tillögum um staðla fyrir samhæfð AI‑viðbætur. Ef samfélagið skilar nothæfum frumgerðum gætu helstu DAW‑framleiðendur og streymisveitur byrjað að innleiða LLM‑stuðningsaðstoð í vörur sínar, og breytt núverandi rannsóknahype í dagleg verkfæri til sköpunar. Framkvæmdin byggir á

Frontiers — https://www.frontiersin.org/research-topics/80293/ubiquitous-musical-signal-proc arxiv.org — https://arxiv.org/abs/2511.10289 www.merl.com — https://www.merl.com/publications/docs/TR2025-116.pdf link.springer.com — https://link.springer.com/content/pdf/10.1186/s13636-024-00353-7.pdf www.emergentmind.com — https://www.emergentmind.com/papers/2409.01864 Mastodon — https://mastodon.social/@theinternetiscrack/116426028439308935

36

3 klukkustundir með Claude Opus 4.7: virk námsvefapp og fjarlæg MCP – ein í einu

HN +6 heimildir hn

anthropicclaudecohere

Claude Opus 4.7 sýndi fram á langtíma sjálfstæði sitt í þriggja klukkustunda lifandi prófi sem skilaði fullkomlega virkri námsvefapp og fjarlægum módelstýringarpaneli (MCP) án kóða skrifaðs af manninum. Forritarinn, sem vann út frá einu spurningarorði, bað Claude um að hanna notendaviðmót, búa til Flask bakenda, tengja PostgreSQL gagnagrunn og birta API sem gæti verið kallað frá öðru vafra‑stýrðu stjórnborði. Í nokkrum mínútum gaf módelið út fullkomna verkefnaskel, og eftir stutta lotu af skýringaspurningar bætti það við auðkenningu, bætt við síðuuppsetningu og sett upp stafla á ókeypis Heroku tilvik. Við lokun fundarins var vefappið í lofti, hægt var að slá inn gögn, og fjarlægi MCP leyfði notandanum að breyta módelstærðum og sjá notkun tákna í rauntíma. Ástæðan fyrir því að þetta skiptir máli er tvíþætt. Fyrst staðfestir prófið þær fullyrðingar sem Anthropic gerði í eigin útgáfuupplýsingum um að Opus 4.7 geti haldið „erfitt verkefni“ í klukkustundir, skref langt frá fyrri módelum sem oft hættu eftir nokkur hundruð tákna. Í öðru lagi minnkar hæfni til að framleiða endanleg framleiðslukóða umhverfisferlið sem takmarkaði AI‑hjálpað þróun við brot og frumgerðir. Fyrir sprotafyrirtæki og stórfyrirtæki sem þegar glíma við skort á hæfileikum gæti módel sem sjálft getur skilað í notkunarhæfum þjónustum breytt verkfræðibúskap og flýtt fyrir tíma til markaðar. Það sem þarf að fylgjast með næst er komandi samþætting Anthropic á Opus 4.7 í Vertex AI og AWS Bedrock, sem mun gera módelið aðgengilegt í stórum mæli og mögulega lækka $5‑$25 á milljón tákna hindrunina. Samfélagið prófar einnig bestu vinnuaðferðir sem para nákvæmar áætlanir við „háa‑áreynslu“ spurningarorð, tækni sem var dregin fram í fyrri greiningu okkar á frammistöðu Opus 4.7 þann 18. apríl. Eftirfylgjandi viðmið gegn Sonnet 4.8 og Mythos 5 mun sýna hvort sjálfstæði Opus breytist í stöðuga gæði yfir mismunandi sviðum, og hvort forritarar munu taka það upp sem aðalforritunarpartnar eða halda því í hliðina sem sértækan aðstoðarmann.

HN — https://github.com/AmmarSaleh50/study-dashboard-demo www.youtube.com — https://www.youtube.com/watch?v=OIfRt1oyAss www.anthropic.com — https://www.anthropic.com/news/claude-opus-4-7 claude.com — https://claude.com/resources/tutorials/working-with-claude-opus-4-7 apidog.com — https://apidog.com/blog/claude-opus-4-7-free/ claudefa.st — https://claudefa.st/blog/guide/development/opus-4-7-best-practices

36

Mastodon +6 heimildir mastodon

agentschipscopilotmicrosoft

Microsoft hefur hækkað verðskýringarnar á Surface vörulínunni, bætt $100–$500 við flest líkan, í takt við að iðnaðurinn glímir við endurnýjaðan skort á vinnsluminni (RAM). Hækkunin, sem er staðfest í Microsoft‑versluninni og skráð af Windows Central, endurspeglar óhóflega hækkaða kostnað við DRAM‑ og NAND‑flíka, sem hafa verið þrýstir af eftirspurnaraukningum á tímum heimsfaraldurs, flasakörum í framboðarkeðju og sprengikrafti gervigreindar‑gagnaverða. Með því að láta neytendur bera hærri kostnað íhluta, gefur Microsoft til kynna að skorturinn sé ekki lengur tímabundinn flækja heldur byggingarbundin takmörkun sem snertir dýrari tölvur. Aðgerðin nær langt út fyrir fartölvumarkaðinn og setur þrjá stærstu framleiðendur minnisflipa—SK Hynix, Micron og SanDisk (NAND‑deild Western Digital)—í fjárfestingarathygli. SK Hynix, heimsins næststærsti DRAM‑birgi, nýtir sér áætlaða kapacitetsaukningar í Suður-Kóreu, sem miða að því að bæta um meira en 300 GB á sekúndu af nýjum framleiðsluárangri til ársins 2027. Micron, eina bandaríska DRAM‑framleiðandinn, er í keppni um að auka 3‑D‑stafla tækni sína, en hagnaður fyrirtækisins er enn óstöðugur vegna breytilegs eftirspurnar frá bæði neytendatölvum og fyrirtækja‑AI‑verkefnum. SanDisk, þó aðallega NAND‑spilari, nýtir fjölbreyttan vöruúrval sem innifelur solid‑state drif fyrir gagnaverstölvuþjóna, hluta sem vaxandi vegna þess að generative‑AI módel þurfa sífellt meiri geymslu. Fjárfestar ættu að fylgjast með ársfjórðungsárangri til að greina hvernig hvert fyrirtæki jafnar birgðir sínar gegn áframhaldandi flíkur‑uppsöfnun, auk tilkynninga um nýja framleiðslukapacitet eða sameiginlegar viðskipti sem gætu breytt samkeppnisstöðu. Frekari verðbreyting frá Microsoft, eða umferð í átt að öðru silíki eins og LPDDR5X, myndi prófa eftirspurnar‑elastík og gæti umbreytt tekjuútliti fyrir þessa þrjá framleiðendur. Næsta árangursárstíð, áætluð fyrir snemma í þriðja fjórðungi, mun líklega sýna hver framleiðandi er best í stakk búnir til að græða á áframhaldandi minniskröfu.

Mastodon — https://jforo.com/@yayafa/116424012978020604 www.pcmag.com — https://www.pcmag.com/news/microsoft-raises-prices-of-surface-laptops-amid-memor www.tradingkey.com — https://www.tradingkey.com/analysis/stocks/us-stocks/261779769-microsoft-surface www.msn.com — https://www.msn.com/en-us/news/technology/the-memory-shortage-strikes-again-this finance.yahoo.com — https://finance.yahoo.com/sectors/technology/articles/microsoft-raises-surface-p www.windowscentral.com — https://www.windowscentral.com/hardware/surface/microsoft-reveals-major-price-in

32

fly51fly (@fly51fly) á X

Mastodon +6 heimildir mastodon

Kínverskur gervigreindarrannsakandi og prófessor við Beijing University of Posts and Telecommunications, fly51fly, tilkynnti nýja nálgun til að auka getu stórra tungumálalíkana (LLM) til að vinna með mjög löng inntök. Í færslu á X kynnti hann „Shuffle the Context“, sjálf‑útdráttar (self‑distillation) aðferð sem breytir vinsælu Rotary Positional Embedding (RoPE) til að varðveita upplýsingar betur yfir lengri táknaglugga. Með því að blanda handahófskenndum hluta af samhengi í kennslu‑nemanda (teacher‑student) þjálfunarhringi, neyðir aðferðin líkanið til að læra staðsetningalausa (position‑agnostic) framsetningar á meðan röð er enn virt, sem gerir það kleift að halda samhangandi texta yfir tugþúsundir tákna. Framfarirnar eru mikilvægar vegna þess að meðhöndlun langt samhengi er ennþá helsta takmörk LLM í raunverulegum forritum, svo sem greiningu á lögfræðilegum samningum, yfirferð vísindalegra greina og fjölþrepa samtöl. Núverandi lausnir — renna gluggar (sliding windows), endurheimt‑aukið framleiðsla (retrieval‑augmented generation) eða að stækka athyglina (attention) í 100 k‑táknaglugga — krefjast annaðhvort mikils útreikningskostnaðar eða fórna nákvæmni. „Shuffle the Context“ lofar léttvægri aðlögun sem er hægt að beita á fyrir‑þjálfaða líkön án fullrar endurþjálfunar, og gæti þannig skilað hærri nákvæmni í viðmiðum eins og LongBench og í sértækum verkefnum sem krefjast djúprar röksemdafærslu yfir víðfeðmtum textum. Eins og við skýrðum 6. apríl, hefur fly51fly verið áberandi r voice á X, þar sem hann deilir nýjungum frá tjáningargreindum í stafrænum sýndarímyndum til kóða‑miðuðra LLM. Þessi nýjasta framlög bætir nýjum vídd í hans feril, með áherslu á vandamál sem breið AI-samfélagið er að keppa um að leysa. Hvað á eftir að fylgjast með: Fullur grein er væntanlegur á arXiv innan nokkurra daga, ásamt opnum kóðaútfærslu. Snemma notendur munu líklega bera aðferðina saman við OpenAI‑GPT‑4 Turbo með 128 k‑táknaglugga og Anthropic‑Claude 2.1. Atvinnugreiningarmenn ættu að fylgjast með hvort kínversk rannsóknarstofnanir eins og Zhipu AI eða Alibaba innleiði „Shuffle the Context“ í næstu kynslóð líkanna, og hvort aðferðin hentar fjölmiðla‑ eða endurheimt‑aukið pípuröð. Ef kröfurnar standast, gæti þessi nálgun orðið staðlað viðbótartól til að stækka samhengi‑glugga án óhóflegs kostnaðar við að þjálfa enn stærri transformer‑líkan.

Mastodon — https://mastodon.sayzard.org/@sayzard/116423426360245531 x.com — https://x.com/fly51fly mobile.twitter.com — https://mobile.twitter.com/fly51fly/status/1633950330948927490 piclur.com — https://piclur.com/profile/fly51fly github.com — https://github.com/fly51fly twitter.com — https://twitter.com/fly51fly/status/1671472603880636418

32

scythe@八方塞がり (@keiyotokei) á X

Mastodon +6 heimildir mastodon

gpt-5openai

OpenAI hefur hafið GPT‑5.4‑Pro, nýjan hágæða stórt tungumálalíkani sem er í boði á grunnverði 100 $ á mánuði. Tilkynningin, sem var sett á X af notandanum @keiyotokei, merkir að fyrirtækið reynir að gera sín mest hæfileikaríkustu líkön fjárhagslega aðgengilegri eftir tímabil þar sem aðeins fyrirtækjavörðurir fengu aðgang að dýrum lausnum. Fyrirlið er mikilvægt því það minnkar bilið milli nýjustu gervigreindar og fjárhagsáætlana smáfyrirtækja, rannsóknarlabba og jafnvel háþróaðra áhugamanna. Fram til þessa voru öflugustu útgáfur OpenAI‑líkananna—eins og GPT‑4 Turbo—í rauninni læst bak við notkunarbundna API‑kröfur eða dýrar fyrirtækjavörðurir. Fast verð á 100 $ gefur “pro‑grade” líkan innan seilingar margra norðurlandafyrirtækja sem hafa þurft að treysta á eldri útgáfur eða á samkeppnisaðila eins og Anthropic og Google Gemini. Fyrir forritara einfaldar áætlanagerð með fyrirsjáanlegum kostnaði þróun á vörum sem þurfa stöðuga, lágseinkunartíma svar,

Mastodon — https://mastodon.sayzard.org/@sayzard/116422981340364339 mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1275651441080795138 mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1382016076171472899 x.com — https://x.com/team_happofusa x.com — https://x.com/hashtag/八方塞がり mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1381869384646291459

32

Mastodon +6 heimildir mastodon

Víruset innlegg á X í þessari viku kveikti nýjan umfjöllunarmynd um hvernig tæknifyrirtækið reynir að „tæma“ stór tungumálalíkön (LLM). Skilaboðin, sem AI‑útskýrandi Mikael Sundberg birti, líkir nútíma tilraunum til stjórnunar LLM við Warhammer 40 K tæknapríst sem syngur til Vélahimnunnar: „Fólk sem reynir að stjórna LLM eru bara W40K tæknaprístur sem biðja Vélahimnuna. Send toot.“ Þessi léttir, en íkveikandi samanburður safnaði fljótt þúsundum like- og endurdeilinga og flóð af athugasemdum frá rannsakendum, siðfræðingum og áhugafólki um allan heim. Samanburður Sundbergar snertir djúpa menningarlegan spennu. Á annarri hlið eru fyrirtæki og stjórnendur að setja upp öryggisramma – API‑kerfi til síun spurninga, endurskoðanir á notkunarstefnu og nýlegar ákvæðingar í „AI Act“ – til að tryggja að gerandi gervigreind samræmist samfélagslegum gildum. Á hinni hliðinni halda forritarar því fram að slíkar aðgerðir líti oft út eins og rituð trúarlegar hefðir frekar en raunveruleg verkfræði, tilfinning sem speglast í Warhammer‑sögunni þar sem Adeptus Mechanicus telur að hver bilun sé óánægð Vélahimna sem þarf að friða með helgisiðum. Af hverju er þessi líking mikilvæg? Tvöfalt. Fyrst og fremst kristallísar hún vaxandi óánægju með það að ofstefna stjórn gæti hamlað nýsköpun án þess að takast á við raunveruleg tæknileg vandamál í tengingu og útskýranleika. Í öðru lagi umbreytir memedrifin rammi opinberum umræðum, breytir tæknilegri stefnumótun í menningarlega frásögn sem nær til breiðari, óteknískra áhorfenda. Með því að vísa í ástsælt vísindaskáldsagnaverk dregur innleggið niður hindrunina fyrir almenning að takast á við flókin öryggismál í AI. Það sem á að fylgjast með næst eru áhrifin á stefnumótun og framtíðaráætlanir iðnaðarins. Ráðgjöf Evrópusambandsins um AI‑lögin, sem á að vera tilbúin seinna í þessum mánuði, gæti vísað

Mastodon — https://mastodon.zergy.net/@Enalys/116426597057162048 www.reddit.com — https://www.reddit.com/r/40kLore/comments/1bvnce6/machine_spirits_what_are_they_ steamcommunity.com — https://steamcommunity.com/app/2186680/discussions/0/4298195009695311211/?ctp=2 warhammer40k.fandom.com — https://warhammer40k.fandom.com/wiki/Machine_Spirit wh40k.lexicanum.com — https://wh40k.lexicanum.com/wiki/Machine_spirit www.reddit.com — https://www.reddit.com/r/40kLore/comments/100ibe5/so_in_40k_praying_to_machines_

26

Leiðandi líkön eru nú „næstum ógreinanleg“ frá hvoru öðru þegar kemur að frammistöðu

Mastodon +6 heimildir mastodon

Ný skýrsla frá Stanford Institute for Human‑Centered Artificial Intelligence (HAI) sýnir að frammistöðuá milli heimsins leiðandi tungumálalíkana hefur í raun horfið. Í fjölda viðmiðunartækja skora OpenAI‑GPT‑4‑Turbo, Anthropic‑Claude 3, Google‑Gemini 1.5 og fjölmörg opin líkön eins og Llama 3 og Mistral‑7B innan nokkurra prósentustiga frá hvoru öðru. Rannsóknin lýsir þessu fyrirbæri sem „næstum ógreinanleika“ og bendir á að opin líkön séu nú „samkeppnishæfari en nokkru sinni fyrr“ og að þau stefni í átt að sömu getu‑mörkum. Samanburðurinn er mikilvægur vegna þess að hann rofar upp hefðbundna vopnabaráttuna sem byggðist á hráum getu. Þegar hráar niðurstöður greina ekki lengur milli birgja, færist keppniskrafturinn í átt að aukaatriðum: útreikningskostnaður, tafartími, sveigjanleiki í fínstillingu, öryggistól, og læsingu í vistkerfinu. Fyrir fyrirtæki þýðir það breiðara úrval valkosta og möguleikann á að skipta út eigendarsniðnum API fyrir opið líkön án þess að fórna frammistöðu. Fyrir iðnaðinn er líklegt að keppnin skerist um reikniritun, verðmódel og ábyrgðar‑AI vottanir frekar en um áberandi getuuppfærslur. Eins og við skýrðum 17. apríl, bentu endurgerð okkar á Mythos‑niðurstöðum Anthropic með opinberum líkönum þegar á milli lína á að minnka bilið; Stanford‑skýrslan staðfestir að þróunin sé nú kerfisbundin. Næstu mánuðir munu sýna hvernig fyrirtæki bregðast við. Fylgist með útgáfu næstu kynslóða opinna líkans, verðlagningarbreytingum frá skýjaþjónustuaðilum og nýjum viðmiðunarsöfnum eins og HELM 2.0 sem miða að því að mæla kostnaðar‑ og öryggismælikvarða. Reglugerðarstofnanir eru einnig að vænta að leggja áherslu á gagnsæi og samræmingarstaðla, og breyta þessum skilyrðum í nýja keppniskröfur á markaði þar sem hrá frammistaða er ekki lengur aðgreiningarþátturinn.

Mastodon — https://tldr.nettime.org/@remixtures/116422664607009746 arxiv.org — https://arxiv.org/html/2510.01731v2 arxiv.org — https://arxiv.org/html/2509.14223v1 news.ycombinator.com — https://news.ycombinator.com/item?id=43856172 studyfinds.org — https://studyfinds.org/the-ai-scam-that-could-threaten-public-opinion-research/ cybernative.ai — https://cybernative.ai/t/distinguishing-genuine-self-modeling-from-stochastic-dr

26

Wei Ping (@_weiping) á X

Mastodon +6 heimildir mastodon

deepseek

Kínverskt gervigreindarlab Zhipu AI hefur gefið út tækniskýrslu um nýjustu stórt tungumálalíkanið sitt, GLM‑5, og skjalinu er þegar lýst sem áhrifamestu greiningunni síðan DeepSeek‑V3/R1. Skýrslan, sem NVIDIA-virðulegur rannsakandi Wei Ping dregur fram á X, lýsir ýmsum nýjungum í athyglis‑skilvirkni—þar á meðal blönduðu skilvirku‑athyglisafbrigði, þunnt athyglismynstur og renna‑glugga‑aðferð—sem eru studdar af umfangsmiklum afleiðslu‑prófanir og frammistöðumat. Mikilvægi málsins felst í því að líkanið getur skilað sambærilegri eða betri ruglingsstuðul (perplexity) en samtímaliðir, á sama tíma og það minnkar minni- og reikniverkun um allt að 40 % . Slíkar ábætur takast á við vaxandi kostnað við þjálfun og þjónustu margra milljarða færða líkana, hindrun sem hefur dregið úr útbreiðslu utan vel fjármagnaðra skýjaþjónustuaðila. Með því að birta nákvæmar tilraunargögn veitir GLM‑5‑teymið rannsóknaumhverfinu endurtekna innsýn sem gæti flýtt fyrir innleiðingu þunnts og staðbundins athyglis í gegnum LLM‑vistkerfið. Stuðningur Wei Ping er mikilvægur: hans vinna hjá NVIDIA snýst um vélbúnaðar‑vitt aðlögun líkana, og opinber loforð hans bendir til þess að tæknin í GLM‑5 sé samrýman við nýja H100‑samrýma hugbúnaðarpakkan NVIDIA. Ef niðurstöðurnar breytast í opinn kóða eða samþættingu við NVIDIA TensorRT‑LLM, gætu þróunaraðilar séð tafarlausa frammistöðubætur á núverandi innviðum. Það sem þarf að fylgjast með næst er formleg útgáfa GLM‑5‑þyngdar, væntanlegar frammistöðumat á HELM‑ og MMLU‑prófunasöfnum, og möguleg samstarfsauglýsingar milli Zhipu AI og vélbúnaðaraðila. Jafnframt verður mikilvægt að fylgjast með eftirfylgjandi greinum sem kanna hvernig skýrt athyglisafbrigðinu er hægt að stækka í trilljón‑færða umhverfi, skref sem gæti umbreytt samkeppnislandslaginu milli kínverskra og vestrænna LLM‑þróunaraðila.

Mastodon — https://mastodon.sayzard.org/@sayzard/116415417977650089 www.youtube.com — https://www.youtube.com/channel/UCQMZ8SB9-tX8gzXRPR5LBuw www.tiktok.com — https://www.tiktok.com/@weiping1 www.linkedin.com — https://www.linkedin.com/pub/dir/Weiping/+ aguea.net — https://aguea.net/_weiping users.encs.concordia.ca — https://users.encs.concordia.ca/~weiping/

26

Tinder og Zoom bjóða upp á “sönnun á mannlegu” augnaskönnun til að berjast gegn gervigreind

Mastodon +6 heimildir mastodon

Tinder og Zoom hafa tilkynnt að þeir muni innleiða augnaskönnunartækni í vettvangana sína sem “sönnun á mannlegu” aðgerð til að draga úr svikum og virkni gervigreindar‑gerðra persónuskipta og róbóta. Þessi eiginleiki, sem er áætlaður í takmarkaða beta útgáfu seinna á þessu fjórðungi, tekur upp fljótlegan skönnun á netkerfismynstur í gegnum myndavélina á tækinu og ber það saman við ör

Mastodon — https://sunny.garden/@greenpete/116421397336510610 mashable.com — https://mashable.com/live/ces-2026-news-live-blog-updates stareintothelightsmypretties.jore.cc — https://stareintothelightsmypretties.jore.cc/tag/analytics/ www.freelancer.com.bd — https://www.freelancer.com.bd/jobs/mobile-app-development/4 www.freelancer.com — https://www.freelancer.com/job-search/freelance-microsoft-azure/ stareintothelightsmypretties.jore.cc — https://stareintothelightsmypretties.jore.cc/tag/robots/

24

Shapley-gildi-stýrð aðlögunarmyndunarnám til útskýranlegrar fjármálasvikagreiningar með

ArXiv +5 heimildir arxiv

Shapley Value‑stýrð aðlögunarleg samsetningarnám til útskýrandi

ArXiv — https://arxiv.org/abs/2604.14231 www.sciencedirect.com — https://www.sciencedirect.com/science/article/pii/S1544612323006815 journals.sagepub.com — https://journals.sagepub.com/doi/10.1177/18724981241289751 www.researchgate.net — https://www.researchgate.net/publication/390235753_Explainable_AI_XAI_for_Fraud_ lrc.perdanauniversity.edu.my — https://lrc.perdanauniversity.edu.my/sdi/shapley-value-guided-adaptive-ensemble-

24

Gmail‑merkingabrúin á Claude Cowork brást nýlega

HN +6 heimildir hn

claudegooglegpt-5reasoning

Claude Cowork’s Gmail‑merkingabrú er orðinn óvirkur og hefur skilið þúsundum notenda í ómöguleika að samstilla tölvupóstmerkingar með AI‑drifnu vinnusvæðinu. Bilunin kom í ljós snemma á þriðjudaginn þegar samþættingin, sem sjálfkrafa speglar Gmail‑merkingar sem verkefnamörk Claude‑Cowork, byrjaði að skila 502 villum. Anthropic staðfesti bilunina á stöðusíðu sinni og útskýrði að hún stóðst vegna nýrrar breytingar á Gmail API Google, sem braut við auðkenningaráferðina sem brúin notar. Villan er mikilvæg vegna þess að brúin er hornsteinn í loforði Claude Cowork um að breyta venjulegum innhólmum í samvinnu‑vitneskapsgrunn. Með því að draga merkingagögn inn í samhengi Claude getur kerfið birt viðeigandi þræði, lagt til næstu skref og fært líkanið nýjustu upplýsingarnar án handvirkrar afritunar. Fyrirtæki sem hafa byggt innri vinnuferla um þessa sjálfvirkni standa nú frammi fyrir tafir í miða‑flutningi, seinkunum í samþykktum og skyndilegri þörf á handvirkum ferlum. Með 2 milliár notendum Google er jafnvel sértæk bilun í raun áhrif á breiðari AI‑afkasta markaðinn og sýnir hversu náið nútíma vinnutól eru háð stöðugum API frá þriðju aðila. Anthropic hefur lofað flýtileiðrétting innan 48 klukkustunda og er að setja inn varasöm OAuth‑tókunakerfi til að verja gegn framtíðarbreytingum á API. Áhorfendur munu fylgjast með því hversu fljótt lagfæringin endurheimtir fulla merkingasamstillingu og hvort Google muni skerpa á tilkynningastefnu um API‑breytingar, skref sem gæti neyðað aðrar AI‑vettvangslausnir endurhönnuðu sambærilega tengi. Atvikið endurlýsir einnig umræður sem vaknaði í kjölfar fyrri umfjárðar okkar um Claude Opus og Claude Code útgáfur Anthropic, og varpar ljósi á jafnvægið milli öflugra, samhengi‑ríkra líkana og viðkvæmni límmiðilsins sem bindur þau við daglegt hugbúnað. Næstu dagar munu sýna hvort Claude Cowork geti endurheimt traust eða hvort notendur snúi sér að þolnari, sjálfhýstum lausnum.

HN — https://news.ycombinator.com/item?id=47811466 threadreaderapp.com — https://threadreaderapp.com/user/JafarNajafov zenvanriel.com — https://zenvanriel.com/ai-engineer-blog/ hackernewsday.com — https://hackernewsday.com/ www.classicfilmtvcafe.com — https://www.classicfilmtvcafe.com/2009/10/31-days-of-halloween-one-good-thing.ht www.workerscompensation.com — https://www.workerscompensation.com/additional-education-materials/45270/

Allar dagsetningar