AI News — 2026-04-17

324

Claude Design

HN +5 kilder hn

anthropicclaude

Anthropic Labs lancerede Claude Design tirsdag og positionerede den nye tjeneste som en samarbejdende AI‑partner til visuel skabelse. Det cloud‑baserede værktøj giver brugerne mulighed for at generere polerede designs, prototyper, slide‑decks og én‑sides briefs ved at give Claude, Anthropics flagskibs‑sprogsmodel, en prompt og derefter finpudse resultatet med indbyggede redigeringsfunktioner. En fremtrædende integration med Canva muliggør øjeblikkelige brand‑konforme justeringer, mens en direkte overlevering til Claude Code lader produktteams sende prototyper videre til produktionsklare komponenter. Lanceringen udvider Anthropics nylige satsning på multimodal AI. Efter en række opdateringer til Claude Opus 4.7 og udrulningen af Claude Code til udviklere, retter virksomheden sig nu mod ikke‑tekniske grundlæggere, produktchefer og designere, der mangler formel designuddannelse. Ved at kombinere tekst‑til‑billede‑generering, layoutforslag og kode‑eksport, sigter Claude Design mod at komprimere idé‑til‑prototype‑cyklussen, som traditionelt kræver separate værktøjer som Figma, Canva og front‑end‑rammer. Som vi rapporterede den 17. april, har den hurtige adoption af Claude Code allerede rejst bekymringer om budgetoverskridelser og behovet for retningslinjer for bedste praksis. Claude Design arver de samme operationelle udfordringer: virksomheder skal overvåge token‑forbrug på tværs af tekst, billede og kode‑generering og afgøre, om bekvemmeligheden opvejer omkostningerne. Produktet rejser også konkurrencemæssige spørgsmål for etablerede design‑AI‑platforme som Adobe Firefly og Microsoft Designer, som endnu ikke har tilbudt en problemfri kode‑overlevering. Hold øje med Anthropics prismodel og enterprise‑grade SLA‑detaljer, som forventes lanceret senere på måneden. Tidlige adoptører vil sandsynligvis teste Canvias integration for troværdighed i forhold til brand‑assets, mens udviklere vil undersøge robustheden i Claude Code‑overleveringer. De kommende uger bør afsløre, om Claude Design kan blive den foretrukne “design‑via‑prompt” hub eller forblive et niche‑tilføjelsesprogram til Anthropics voksende AI‑portefølje.

HN — https://www.anthropic.com/news/claude-design-anthropic-labs en.wikipedia.org — https://en.wikipedia.org/wiki/Claude_Reignier_Conder claude.com — https://claude.com/resources/tutorials/using-claude-design-for-prototypes-and-ux techcrunch.com — https://techcrunch.com/2026/04/17/anthropic-launches-claude-design-a-new-product www.canva.com — https://www.canva.com/newsroom/news/canva-claude-design/

230

Ronan Farrow om Sam Altmans ‘ubegrænsede’ forhold til sandheden

Mastodon +7 kilder mastodon

openai

Sam Altmans ry for “ubegrænset” historiefortælling er flyttet fra bestyrelseslokaler til forsiden af The New Yorker. I et to‑timer langt interview dissekerede den undersøgende journalist Ronan Farrow, assisteret af Nilay Patel fra The Verge, New Yorker‑profilen, der fremstiller Altman som en serieløgnere, der bøjer fakta for at sikre finansiering, omgå regulering og holde OpenAIs strategiske træk uigennemsigtige. Farrow, som har brugt 18 måneder på at undersøge Altmans beslutningstagning, argumenterer for, at CEO’ens villighed til at “strække sandheden” ikke er en excentrisk ledelsesstil, men en systemisk risiko for en organisation, der styrer verdens mest kraftfulde AI‑modeller. Interviewet er vigtigt, fordi OpenAIs troværdighed ligger til grund for alt fra virksomheders licensaftaler til statslige sikkerhedsvurderinger. Hvis administrerende direktør rutinemæssigt vildleder investorer, partnere eller regulatorer, kan de sikkerhedsforanstaltninger, der er indbygget i modeludgivelser, blive undermineret, og politiske drøftelser, som allerede kæmper med AI‑s uigennemsigtighed, kan blive endnu mere vanskelige. Artiklen genopliver også tidligere bekymringer, vi fremhævede den 17. april, da interne RAND‑dokumenter antydede, at Altmans godkendelsesansøgning blev blokeret på grund af udenlandske forbindelser og hint om, at OpenAI på et tidspunkt overvejede at auktionere avancerede modeller til nationer. Hvad man skal holde øje med: OpenAIs bestyrelse skal mødes i begyndelsen af maj, og insider‑kilder antyder, at en formel undersøgelse af ledelsespraksis kan stå på dagsordenen. Kongreskomitéer, der har påbegyndt høringer om AI‑sikkerhed, kan citere Farrow‑interviewet som bevis på ledelses‑uigennemsigtighed. Samtidig vil Altmans næste offentlige optræden – forventet på Infrastructure Summit 2026 – blive gransket for enhver indrømmelse eller afvisning. Den udviklende fortælling vil teste, om OpenAI kan genoprette tilliden, eller om Altmans “ubegrænsede” forhold til sandheden vil udløse dybere strukturelle reformer.

Mastodon — https://flipboard.social/@TechDesk/116420431293481397 en.wikipedia.org — https://en.wikipedia.org/wiki/Sam_Altman www.theverge.com — https://www.theverge.com/podcast/911753/sam-altman-openai-ronan-farrow-new-yorke sfstandard.com — https://sfstandard.com/pacific-standard-time/2026/04/15/sam-altman-ronan-farrow- pagesix.com — https://pagesix.com/2026/04/07/hollywood/chatgpt-gives-its-opinion-of-sam-altman news.google.com — https://news.google.com/stories/CAAqNggKIjBDQklTSGpvSmMzUnZjbmt0TXpZd1NoRUtEd2pw Mastodon — https://buc.ci/abucci/p/1776438751.344359

219

Claude Opus 4.7 koster 20–30 % mere pr. session

HN +6 kilder hn

agentsanthropicclaude

Anthropic annoncerede tirsdag, at deres flagskibsmodel Claude Opus 4.7 nu koster 20‑30 % mere pr. session end den 4.6‑version, der blev udgivet i februar. Prisforhøjelsen skyldes en ny tokenizer, der kan generere op til 35 % flere tokens for den samme input, hvilket leverer højere kvalitet i fuldførelserne og en tættere integration med virksomhedens agent‑team‑funktioner. Under Anthropics nuværende prisstruktur faktureres Opus‑forbrug pr. million tokens oven på “Max”-abonnementet, som ligger mellem $100 og $200 om måneden, så den ekstra token‑tæthed omsættes direkte til højere regninger pr. session for udviklere og erhvervskunder. Flytningen er vigtig, fordi den skærper en fremvoksende priskløft på markedet for generativ AI. Mens OpenAIs GPT‑4o og Googles Gemini 3 Pro har holdt per‑token‑priserne relativt stabile, har Anthropics seneste opgraderinger gentagne gange presset omkostningerne op – Claude Opus 4.6 sprang allerede 60 % i pris, når den køres i adaptiv tilstand, og den seneste stigning løfter den samlede udgift for en typisk 10‑minutters kodnings‑ eller forskningssession til $2‑$3 for tunge brugere. Analytikere advarer om, at “AI subscription pricing crisis” kan tvinge både startups og store virksomheder til at revurdere deres modelvalg, især når budgetbegrænsede teams skifter mod billigere, lavere‑niveau‑modeller eller open‑source‑alternativer. Hvad man skal holde øje med: Anthropic har antydet, at en kommende Opus 4.8 kan forbedre token‑effektiviteten, hvilket potentielt kan dæmpe prispresset. Observatører vil også følge, om virksomheden justerer sine lagdelte abonnementsplaner eller indfører volumenrabatter for enterprise‑flåder. Endelig vil konkurrenternes prisrespons – især eventuelle justeringer fra OpenAI eller Google – indikere, om markedet bevæger sig mod en ny ligevægt eller en vedvarende prisstigning. Som vi rapporterede om Claude Design tidligere denne måned, omformer den hurtige udvikling af Anthropics modeller, hvordan virksomheder budgetterer for AI, og Opus 4.7‑prisændringen er det seneste flashpoint.

HN — https://www.claudecodecamp.com/p/i-measured-claude-4-7-s-new-tokenizer-here-s-wh thezvi.substack.com — https://thezvi.substack.com/p/claude-opus-46-escalates-things-quickly screenapp.io — https://screenapp.io/blog/claude-ai-pricing www.implicator.ai — https://www.implicator.ai/claudes-rate-limits-arent-a-capacity-problem-theyre-a- apidog.com — https://apidog.com/blog/claude-opus-4-7/ www.lesswrong.com — https://www.lesswrong.com/posts/HtdrtF5kcpLtWe5dW/claude-opus-4-5-is-the-best-mo

216

Alt, du behøver at vide om Claude Opus 4.7

Dev.to +6 kilder dev.to

anthropicclaude

Anthropic præsenterede Claude Opus 4.7 den 16. april og stiller den som virksomhedens mest kapable generelt tilgængelige model til dato. Opgraderingen kommer som en drop‑in‑erstatning for Opus 4.6 – API‑et, priserne og token‑grænserne forbliver uændrede – men den underliggende arkitektur leverer et mærkbart løft på tværs af en række arbejdsbelastninger. Benchmark‑resultater fra Anthropic viser en effektivitet på +14 %, hvilket betyder, at modellen kan fuldføre den samme opgave med færre tokens, samt en forbedring på +13 % i kodningstests. Endnu mere markant falder fejl ved værktøjsbrug med omkring to‑tredjedele, og de nye “implicit‑need”-tests – et sæt, der kontrollerer, om modellen følger hver under‑instruktion bogstaveligt – bestås for første gang. Modellen kan også fortsætte gennem værktøjsfejl, som tidligere ville afbryde et Opus‑kørsel, en ændring der bør udglatte lang‑horisontale, agentbaserede arbejdsgange. Opus 4.7 udvider kontekstvinduet til én million tokens og tilføjer høj‑opløsnings‑vision med op til 3,75 MP, hvilket muliggør rigere multimodale forespørgsler. En ny tokenizer og en højere “effort”‑indstilling giver udviklere finere kontrol over beregningsallokering, mens modellens hukommelsesbehandling er finjusteret til komplekse, flertrinsprocesser såsom automatiserede kode‑pipelines eller søgninger i virksomheders vidensbaser. Udgivelsen er vigtig, fordi den indsnævrer præstationskløften til OpenAI’s seneste GPT‑4‑Turbo og GPT‑4o‑tilbud, og giver virksomheder et levedygtigt alternativ, der bevarer Anthropic’s sikkerheds‑først‑ry reputation. Med samme prisniveau kan eksisterende Claude‑brugere opgradere uden budgetmæssig påvirkning, hvilket potentielt kan accelerere adoption i sektorer, der er afhængige af pålidelig værktøjsintegration – fra softwareudvikling (husk vores seneste artikel om Claude‑drevne GitHub Actions) til dokumentbehandling og visuel inspektion. Hvad man skal holde øje med: Anthropic’s udrulnings‑metrik vil afsløre, om den reducerede værktøjs‑fejlrate omsættes til højere produktions‑gennemløb. Analytikere vil også følge eventuelle prisjusteringer, efterhånden som modellen skaleres, samt køreplanen mod en Opus 5, som forventes at skubbe kontekst‑grænser og vision‑fidelitet endnu længere. Endelig vil den konkurrencemæssige respons fra OpenAI og Microsoft i det multimodale, høj‑kontekst‑område forme innovationshastigheden i de kommende måneder.

Dev.to — https://dev.to/om_shree_0709/everything-you-need-to-know-about-claude-opus-47-3k www.anthropic.com — https://www.anthropic.com/news/claude-opus-4-7 platform.claude.com — https://platform.claude.com/docs/en/about-claude/models/whats-new-claude-4-7 apidog.com — https://apidog.com/blog/claude-opus-4-7/ felloai.com — https://felloai.com/anthropic-claude-opus-4-7/ kingy.ai — https://kingy.ai/ai/claude-opus-4-7-is-here-everything-you-need-to-know-about-an

193

VentureBeat: OpenAI lancerer GPT‑Rosalind, en ny begrænset adgangsmodel for livsvidenskab, og bredere Codex‑plugin på GitHub

Mastodon +6 kilder mastodon

openai

OpenAI annoncerede torsdag lanceringen af GPT‑Rosalind, en ny resonansmodel, der er bygget specifikt til livsvidenskabelig forskning, samt en bredere Codex‑plugin, der nu er tilgængelig på GitHub. Modellen, der er opkaldt efter Rosalind Franklin, tilbydes gennem et stramt kontrolleret begrænset‑adgangsprogram rettet mod akademiske laboratorier, biotekvirksomheder og farmaceutiske selskaber, som har brug for at accelerere hypotesegenerering, protein‑design og genomik‑analyse. GPT‑Rosalind udvider virksomhedens nylige satsning på domænespecifik AI. I modsætning til den generelle GPT‑4 er modellen finjusteret på millioner af fagfællebedømte artikler, datasæt om kemiske re

Mastodon — https://rbfirehose.com/2026/04/17/venturebeat-openai-debuts-gpt-rosalind-a-new-l venturebeat.com — https://venturebeat.com/technology/openai-debuts-gpt-rosalind-a-new-limited-acce openai.com — https://openai.com/index/introducing-gpt-rosalind/ www.reuters.com — https://www.reuters.com/business/healthcare-pharmaceuticals/openai-launches-ai-m creati.ai — https://creati.ai/ai-news/2026-04-17/openai-launches-gpt-rosalind-ai-model-life- the-decoder.com — https://the-decoder.com/openai-launches-gpt-rosalind-a-reasoning-model-built-for

159

Mark Gadala-Maria (@markgadala) på X

Mastodon +7 kilder mastodon

AI‑videogeneratorer har overskredet en filmisk grænse, ifølge en tweet, der hurtigt gik viralt i det nordiske teknologisamfund. Mark Gadala‑Maria, en konsulent kendt for AI‑drevet SEO‑arbejde, postede et kort klip, der genskaber en ikonisk “Avengers: Endgame”‑kampsekvens med et detaljerings- og bevægelsesniveau, der kan måle sig med professionelle VFX‑pipelines. Den ledsagende billedtekst, skrevet på koreansk, oversættes til “AI producerer optagelser på Avengers‑niveau – jeg er blæst omkuld.” Indlægget, der er linket til en offentligt tilgængelig X‑status, har udløst en strøm af kommentarer om, hvor tæt generativ video nu er på mainstream filmproduktion. Gennembruddet hviler på de seneste fremskridt inden for diffusion‑baseret videosyntese og store transformer‑modeller. Virksomheder som Runway, Meta og OpenAI har hver især udgivet successive versioner af tekst‑til‑video‑værktøjer, der kan gengive 8‑sekunders klip i 720p og nu bevæger sig mod 4K og længere varighed. Det, der adskiller Gadala‑Marias eksempel, er scenens kompleksitet: flere karakterer, dynamisk belysning, partikeleffekter og hurtige kamerabevægelser – alt orkestreret fra en enkelt prompt. Opnåelsen krævede ikke kun en kraftigere backbone‑model, men også raffinerede konditioneringsteknikker, der justerer bevægelsesvektorer med semantisk intention, et problem der har plaget tidligere prototyper. Hvorfor det er vigtigt, er todelt. For underholdningsindustrien lover teknologien at reducere omkostningerne til pre‑visualisering og demokratisere high‑end visuelle effekter, så indie‑skabere kan konkurrere med blockbuster‑studier. For annoncører og marketingsfolk kan evnen til at generere skræddersyet, filmkvalitetsoptagelse på efterspørgsel omforme indholds‑pipelines og rejse spørgsmål om håndhævelse af intellektuel ejendomsret. Samtidig afslører den beregningsmæssige appetit i sådanne modeller – ofte krævende dusinvis af high‑end GPU‑er og terabytes af VRAM – et voksende hardware‑flaskehals, der spejler nylige bekymringer om stigende RAM‑priser. Hvad man skal holde øje med, inkluderer den forestående udrulning af OpenAIs Sora‑API, planlagt til begrænset beta senere i dette kvartal, og Runways annoncerede “Gen‑3”‑opgradering, der lover real‑time rendering ved 30 fps. Brancheobservatører vil også følge, hvordan film‑fagforeninger og ophavsretsorganer reagerer på AI‑genererede gengivelser af beskyttede karakterer. Hvis den nuværende udviklingskurve holder, kan grænsen mellem menneskeskabte VFX og algoritmisk skabelse udviskes inden for måneder, hvilket vil omforme økonomien i filmproduktion på tværs af Norden og videre.

Mastodon — https://mastodon.sayzard.org/@sayzard/116419436141255298 x.com — https://x.com/markgadala mobile.twitter.com — https://mobile.twitter.com/markgadala/status/1671260810755334144 www.instagram.com — https://www.instagram.com/markgadala/ www.linkedin.com — https://www.linkedin.com/in/mark-gadala-maria-a630233a www.24vids.com — https://www.24vids.com/channel/markgadala Mastodon — https://mastodon.sayzard.org/@sayzard/116419436104632401

157

OpenAI lancerer ny AI‑model til livsvidenskabelig forskning

Axios on MSN +9 kilder 2026-04-10 news

openaireasoning

OpenAI præsenterede torsdag GPT‑Rosalind, en specialbygget stor‑sprogsmodel, der skal fremskynde forskning inden for livsvidenskab. Modellen, opkaldt efter kemikeren Rosalind Franklin, er den første i OpenAI’s “Life Sciences”-serie og udgives til en begrænset gruppe af akademiske laboratorier og farmaceutiske partnere, herunder Amgen og Moderna. OpenAI’s leder for livsvidenskabelig forskning, Joy Jiao, fortalte pressen, at modellen er finjusteret på mere end 200 milliarder tokens fra fagfællebedømte artikler, genomdatabaser og kliniske forsøgsrapporter, hvilket giver den en dybere forståelse af biokemi, molekylær biologi og lægemiddelmål‑interaktioner end den generiske GPT‑4‑motor. Lanceringen er vigtig, fordi den markerer et skifte fra generel AI til domænespecifikke systemer, der kan håndtere den komplekse ræsonnement, der kræves i lægemiddelforskning og genomik. Tidlige tests tyder på, at GPT‑Rosalind kan generere plausible hypoteser om proteinbinding, designe CRISPR‑guide‑RNA’er og sammenfatte eksperimentelle protokoller med færre hallucinationer end sine forgængere. Hvis modellen lever op til sit løfte, kan den forkorte pre‑kliniske forskningscyklusser med måneder, sænke omkostningerne for biotek‑startups og intensivere konkurrencen blandt AI‑leverandører, der jagter det milliard‑dollarkløde farmaceutmarked. Initiativet rejser også spørgsmål om dataprivatliv, intellektuelle ejendomsrettigheder og behovet for streng validering, før den anvendes klinisk. Hvad der skal holdes øje med: OpenAI planlægger at åbne modellen for et bredere API‑publikum senere i dette kvartal, sammen med et nyt “Bio‑Plugin”-økosystem, der gør det muligt for forskere sikkert at forespørge proprietære databaser. Brancheobservatører vil følge benchmark‑resultaterne i forhold til Anthropic’s Claude Opus 4.7 samt eventuel reguleringsfeedback fra European Medicines Agency. Hastigheden og pålideligheden af GPT‑Rosalinds forudsigelser vil afgøre, om den bliver et standardværktøj i laboratoriet eller forbliver et niche‑eksperiment.

Axios on MSN — https://www.msn.com/en-us/science/biology/openai-launches-new-ai-model-for-life- www.axios.com — https://www.axios.com/2026/04/16/openai-models-life-sciences-drugs www.reuters.com — https://www.reuters.com/business/healthcare-pharmaceuticals/openai-launches-ai-m www.investing.com — https://www.investing.com/news/stock-market-news/openai-launches-ai-model-gptros finance.biggo.com — https://finance.biggo.com/news/cMTwl50Bh5an-7GhvwsK venturebeat.com — https://venturebeat.com/technology/openai-debuts-gpt-rosalind-a-new-limited-acce Mastodon — https://fed.brid.gy/r/https://bsky.app/profile/did:plc:rhkcyc46ubi523e47bhnkpbb/ Mastodon — https://techhub.social/@nic221/116416797610072228 HN — https://openai.com/index/introducing-gpt-rosalind/

150

Forståelse af Transformere, del 8: Delte vægte i selv‑opmærksomhed

Dev.to +6 kilder dev.to

Et nyt teknisk notat, der blev udgivet i denne uge, udvider serien “Understanding Transformers” med del 8, som tager fat på et længe eksisterende designspørgsmål: Skal selv‑opmærksomhed bruge separate forespørgsels‑, nøgle‑ og værdimatricer, eller kan en enkelt delt vægtmatrix være tilstrækkelig? Forfatterne foreslår et “shared‑self‑attention”‑skema, der erstatter de tre konventionelle matricer (W Q, W K, W V) med én samlet matrix Wₛ, som anvendes på input‑token‑indlejringerne, før opmærksomhedsscorerne beregnes. Papiret gennemgår afledningen, viser hvordan den delte matrix kan opdeles virtuelt under kørsel, og præsenterer eksperimentelle resultater på standard‑benchmark‑sæt for sprogmodeller, som matcher eller let overgår ydeevnen af den traditionelle tre‑matrix‑opsætning, samtidig med at antallet af parametre reduceres med cirka 33 %. Hvorfor dette er vigtigt, er todelt. For det første sænker reduktionen i træ

Dev.to — https://dev.to/rijultp/understanding-transformers-part-8-shared-weights-in-self- arxiv.org — https://arxiv.org/html/2412.00359v2 arxiv.org — https://arxiv.org/html/2511.11553v1 datascience.stackexchange.com — https://datascience.stackexchange.com/questions/118797/self-attention-in-transfo datascience.stackexchange.com — https://datascience.stackexchange.com/questions/85150/understanding-transformers stats.stackexchange.com — https://stats.stackexchange.com/questions/481324/meaning-of-the-value-matrix-in-

148

Stop med at betale for det samme svar to gange: En dybdegående analyse af llm‑cache

Dev.to +7 kilder dev.to

En ny open‑source‑bibliotek kaldet **llm‑cache** vækker opsigt i AI‑udviklingsmiljøet ved at love at reducere omkostningerne ved store‑sprogs‑model‑kald (LLM) med op til 70 procent. Projektet, der blev udgivet på GitHub i denne uge, placerer sig mellem en applikation og enhver LLM‑udbyder — OpenAI, Anthropic, Cohere eller lignende — og gemmer automatisk hvert svar i en isoleret vektor‑lager. Når en efterfølgende forespørgsel matcher en tidligere cachet forespørgsel, leverer biblioteket det gemte svar øjeblikkeligt, uden at gå igennem udbyderens API og de tilhørende per‑token‑gebyrer. Designere af værktøjet understreger, at det fungerer både ved “cache‑miss” og “cache‑hit”: ved et miss videresendes forespørgslen til udbyderen, strømmer svaret tilbage til appen, og skrives i realtid til cachen. Udviklere kan justere time‑to‑live‑indstillinger (TTL), udløsningspolitikker og ligheds‑thresholds, hvilket giver fin‑granuleret kontrol over, hvor aggressivt cachen genbruger svar. Tidlige benchmarks, som forfatterne har offentliggjort, viser latensreduktioner på 30‑40 procent ved gentagne arbejdsbelastninger såsom FAQ‑bots, kode‑kompletteringsassistenter og produkt‑anbefalings‑pipelines. Hvorfor er der så opsigt? LLM‑API’er er blevet en væsentlig udgiftspost for både startups og store virksomheder, og prisen per token stiger fortsat, efterhånden som modellerne bliver større. Ved at fjerne overflødige kald skærer **llm‑cache** ikke kun omkostningerne ned, men mindsker også CO₂‑aftrykket forbundet med gentagen inferens. Desuden betyder bibliotekets plug‑and‑play‑design, at det kan integreres i eksisterende LangChain-, LlamaIndex‑ eller skræddersyede pipelines med minimale kodeændringer. Det, der skal holdes øje med fremover, er hvor hurtigt fællesskabet tager cachen i brug, og om de store cloud‑platforme vil tilbyde native ækvivalenter. Forfatterne har annonceret en kommende “enterprise”‑tilstand med distribuerede cache‑shards og observabilitets‑dashboards, hvilket peger på en bredere bevægelse mod produktions‑klar LLM‑omkostningsoptimering. Hvis de tidlige præstationspåstande holder, kan **llm‑cache** blive en standardkomponent i enhver AI‑drevet produkt‑stack.

Dev.to — https://dev.to/gaurav_vij137/stop-paying-for-the-same-answer-twice-a-deep-dive-i markaicode.com — https://markaicode.com/llm-cost-optimization-production/ pearlite-html.vercel.app — https://pearlite-html.vercel.app/ mrmaheshrajput.medium.com — https://mrmaheshrajput.medium.com/llm-cache-the-secret-weapon-youre-overlooking- www.linkedin.com — https://www.linkedin.com/pulse/stop-paying-same-llm-reasoning-oliver-von-semkov- www.helicone.ai — https://www.helicone.ai/blog/effective-llm-caching Mastodon — https://mstdn.social/@aSweetGentleman/116420858285373471

140

Numerisk ustabilitet og kaos: Kvantificering af uforudsigeligheden i store sprogmodeller

ArXiv +6 kilder arxiv

agentsmultimodal

EN GRUPPE FORSKERE FRA KØBENHAVNS UNIVERSITET OG SAMARBEJDEPARTNERE HAR UDGIVET EN NY ARXIV‑PRE‑PRINT, *Numerical Instability and Chaos: Quantifying the Unpredictability of Large Language Models* (arXiv:2604.13206v1). Artiklen viser, at den flydende‑punkt‑aritmetik, som ligger til grund for moderne transformer‑baserede LLM‑er, kan udløse kaotisk dynamik, hvilket medfører output‑variationer, der ikke kan forklares alene ved prompt‑formulering, temperaturindstillinger eller sampling‑seeds. Ved at injicere mikroskopiske forstyrrelser i modelvægterne og de mellemliggende aktiveringer observerer forfatterne divergerende generationer, selv når den samme input behandles på identisk hardware. Deres eksperimenter dækker GPT‑lignende modeller med 1 milliard til 70 milliarder parametre, både åbne og proprietære arkitekturer, og de kvantificerer ustabiliteten med Lyapunov‑eksponenter og entropi‑mål. Resultaterne er vigtige, fordi LLM‑er bevæger sig fra forsknings‑prototyper til agent‑komponenter inden for finans, sundhedspleje og autonome systemer. Numerisk kaos underminerer reproducerbarhed, gør fejlsøgning vanskeligere og rejser sikkerheds‑bekymringer, når modeller forventes at følge deterministiske politikker. I sikkerhedskritiske arbejdsgange – såsom automatiseret medicinsk triage eller algoritmisk handel – kan uforklarlige udsving i output oversættes til dyre fejl eller overtrædelser af regulativer. Arbejdet forklarer også, hvorfor nylige forsøg på at “debugge” LLM‑adfærd ved at justere prompts ofte giver inkonsistente resultater, idet det peger på en dybere kilde til variation på hardware‑niveau. Forfatterne foreslår tre afhjælpningsveje: højere præcisions‑aritmetik (fx bfloat16 → float32), stokastiske afrundings‑skemaer og arkitektur‑niveau regulering, der dæmper følsomheden over for små vægtændringer. De frigiver en benchmark‑suite til måling af ustabilitet på tværs af nye modeludgivelser. Det næste skridt for fællesskabet vil være at teste disse løsninger på fremtidige modeller på 100 milliarder parametre og at integrere ustabilitets‑tjek i CI‑pipelines. Hold øje med opfølgende studier fra store AI‑laboratorier, der kan adoptere benchmarken, samt med hardware‑leverandører, der tilbyder præcisions‑optimerede acceleratorer med henblik på at stabilisere næste generations LLM‑implementeringer.

ArXiv — https://arxiv.org/abs/2604.13206 en.wikipedia.org — https://en.wikipedia.org/wiki/Large_language_model arxiv.org — https://arxiv.org/pdf/2604.13206 oceanofpdf.com — https://oceanofpdf.com/authors/jay-alammar/pdf-epub-hands-on-large-language-mode www.geeksforgeeks.org — https://www.geeksforgeeks.org/artificial-intelligence/large-language-model-llm/ ArXiv — https://arxiv.org/abs/2604.13395

132

Spring AI SDK til Amazon Bedrock AgentCore: Byg produktionsklare Java AI‑agenter

Dev.to +6 kilder dev.to

agentsamazonopen-source

Spring AI har annonceret den generelle tilgængelighed af sit AgentCore SDK, et Java‑orienteret bibliotek, der indlejrer Amazon Bedrocks nye AgentCore‑runtime i Spring AI‑økosystemet. Det open‑source SDK tilføjer velkendte Spring‑mønstre — annotationer, auto‑konfiguration og sammensatte rådgivere — til Bedrocks agent‑funktioner, så udviklere kan gå fra proof‑of‑concept‑prototyper til produktionsklare tjenester uden at skulle omskrive kernekoden i Python. Udgivelsen er vigtig, fordi Java fortsat er det dominerende sprog for enterprise‑back‑ends, mens opbygning og skalering af generative AI‑agenter traditionelt har krævet skræddersyede Python‑stakke eller tungvægts‑orchestration. Ved at kombinere Bedrocks administrerede, horisontalt skalerbare AgentCore‑runtime med Spring’s velprøvede dependency‑injection‑ og konfigurationsmodel, lover SDK’en en tættere integration med eksisterende CI/CD‑pipelines, lettere observabilitet via Spring Actuator og indbygget support for sikkerhedstjenester såsom AWS Cognito. For virksomheder, der allerede har investeret i Spring Boot, falder barrieren for at adoptere agent‑baseret AI dramatisk, hvilket accelererer anvendelsestilfælde fra automatiserede kundeservice‑bots til dynamisk workflow‑orchestration. Initiativet signalerer også Amazons bestræbelser på at standardisere agent‑udvikling på en cloud‑native runtime, hvilket afspejler den bredere branche‑tendens, vi frem

Dev.to — https://dev.to/om_shree_0709/spring-ai-sdk-for-amazon-bedrock-agentcore-build-pr aws.amazon.com — https://aws.amazon.com/blogs/machine-learning/spring-ai-sdk-for-amazon-bedrock-a letsdatascience.com — https://letsdatascience.com/news/spring-ai-sdk-for-amazon-bedrock-launches-ga-fe www.dotnetramblings.com — https://www.dotnetramblings.com/post/14_04_2026/14_04_2026_13/ dev.to — https://dev.to/aws-heroes/amazon-bedrock-agentcore-runtime-part-5-using-custom-a dev.to — https://dev.to/aws-builders/build-production-ready-ai-agents-with-aws-bedrock-ag

128

OpenAI tilføjer sandboxing til Agents‑SDK med indbygget native isolation

Mastodon +8 kilder mastodon

agentsopenaiopen-source

OpenAI annoncerede den 17. april, at deres Agents‑SDK nu inkluderer indbygget sandboxing og native isolation på operativsystem‑niveau, et skridt der skal dæmme op for den stigende risiko for uautoriserede eller fejlagtige AI‑agenter i produktionsmiljøer. Opdateringen tilføjer en letvægts‑container, som automatisk begrænser filsystemadgang, netværkskald og hukommelsesforbrug for enhver agent, der er bygget med SDK’en, og den leveres som standardindstilling for nye projekter. OpenAI hævder, at funktionen er “transparent for udviklere”, samtidig med at den leverer “virksomhedsniveau‑garantier” om, at en agent ikke kan undslippe sine fastsatte grænser. Ændringen kommer i en periode med øget granskning af “agentisk AI” – autonom software, der kan kæde værktøjer sammen, hente data og handle på vegne af brugere. Seneste hændelser med prompt‑injektion og utilsigtet data‑exfiltration har fået både leverandører og regulatorer til at kræve stærkere sikkerhedsforanstaltninger. Ved at indlejre sandboxing direkte i udviklingskittet håber OpenAI at flytte sikkerhedsbyrden fra downstream‑brugere til selve platformen, en strategi der spejler Anthropics nylige lancering af Claude Cowork, som pakker fil‑manipulationsværktøjer sammen med eksplicitte advarsler om injektionsangreb. For udviklere betyder den native isolation, at de kan prototype og implementere agenter uden at skulle provisionere separate virtuelle maskiner eller tredjeparts‑containere, hvilket potentielt kan accelerere time‑to‑market for intern automatisering, kundeservice‑bots og low‑code AI‑arbejdsprocesser. Sikkerhedsteams vil dog sandsynligvis nøje undersøge sandboxens effektivitet mod sofistikerede undvigelsesteknikker, som allerede er demonstreret i open‑source‑værktøjer som Sandboxie‑Plus. Hvad man skal holde øje med: OpenAIs roadmap for Agents‑SDK peger på en tættere integration med Azures confidential computing‑tjenester, en udvikling der kan hæve standarden for cloud‑native AI‑sikkerhed. Brancheobservatører vil også følge, om sandbox‑modellen bliver en de‑facto‑standard, hvilket kan få konkurrenter som Google DeepMind eller Microsoft til at adoptere lignende standardindstillinger. Endelig vil udrulningen blive testet i virkelige implementeringer, og enhver brist eller omgåelse vil forme den næste runde af regulatorisk vejledning om autonome AI‑agenter.

Mastodon — https://mastodon.social/@winbuzzer/116420608801011910 platform.openai.com — https://platform.openai.com/docs/guides/agents-sdk sandboxie-plus.com — https://sandboxie-plus.com/ composio.dev — https://composio.dev/content/top-claude-skills winbuzzer.com — https://winbuzzer.com/2026/01/13/ai-agents-anthropic-launches-claude-cowork-with www.youtube.com — https://www.youtube.com/watch?v=ZUG9qYTJMsI Mastodon — https://mastodon.social/@winbuzzer/116420370276316425 Mastodon — https://mastodon.social/@winbuzzer/116416268140424424

118

Anthropic lancerer Claude Opus 4.7 med forbedret benchmark‑præstation

NDTV Profit on MSN +7 kilder 2026-03-05 news

agentsai-safetyanthropicbenchmarksclaude

Anthropic meddelte torsdag, at Claude Opus 4.7 overgår sin forgænger, Opus 4.6, på en række industristandard‑benchmark‑test, og indsnævrer afstanden til rivaliserende modeller som OpenAIs GPT‑5.4‑Cyber og Metas Llama 3.5. Virksomheden oplyser, at den nye version leverer en gennemsnitlig stigning på 3 point på MMLU, en 7 % forøgelse på HumanEval‑kodningstestene og en forbedring på 4,2 % på BIG‑Bench‑reasoning‑suiten, samtidig med at de sikkerhedsguardrails, der blev indført med Opus 4.5, bevares. Opgraderingen er vigtig, fordi benchmark‑resultater fortsat er den primære indikator for reel kapacitet på et marked, hvor virksomheder afvejer ydeevne mod omkostninger og overholdelse af regler. Claude Opus 4.7’s forbedringer betyder mere pålidelig kodegenerering, bedre flertrins‑reasoning og strammere kontrol med hallucinationer – funktioner, der direkte adresserer de udfordringer, der har drevet nylige migrationer til OpenAIs GPT‑5.4‑Cyber, som blev præsenteret kun én dag tidligere. Anthropics påstand om, at Opus 4.7 “forbliver konkurrencedygtig”, signalerer et fornyet skub for at bevare sin position i virksomheders AI‑stack, især i regulerede sektorer, hvor dens sikkerhedsprofil er en differentierende faktor. Som vi rapporterede den 16. april, fulgte udrulningen af Claude Opus 4.7 en hurtig række af op

NDTV Profit on MSN — https://www.msn.com/en-in/technology/software/anthropic-launches-claude-opus-4-7 www.edtechinnovationhub.com — https://www.edtechinnovationhub.com/news/anthropic-launches-claude-opus-45-with- www.anthropic.com — https://www.anthropic.com/news/claude-opus-4-1 www.neowin.net — https://www.neowin.net/news/anthropic-launches-claude-opus-45-claiming-its-the-w ishookfinance.com — https://ishookfinance.com/anthropic-claude-opus-4-5-price-cut-benchmark-results www.testingcatalog.com — https://www.testingcatalog.com/anthropic-rolls-out-claude-opus-4-1-with-74-5-swe Mastodon — https://infosec.exchange/@brianbaldock/116417513646742311

109

Claude Code glemte min arkitektur tre gange i sidste uge. Jeg løste det med én SQLite‑fil.

Dev.to +5 kilder dev.to

agentsclaude

En udvikler, der har kæmpet med Anthropic’s Claude Code, annoncerede udgivelsen af Waypath 0.1.1, et lille‑fodaftryk‑værktøj, der giver modellen et vedvarende hukommelseslag. Den open‑source CLI‑ og MCP‑server (multi‑client protocol) gemmer hver interaktion i en enkelt SQLite‑database placeret i ~/.waypath/waypath.db, så Claude Code, GitHub Codex, Cursor og Aider kan huske arkitektur‑beslutninger på tværs af sessioner. Forfatteren siger, at rettelsen stoppede Claude fra at “glemme min arkitektur tre gange i sidste uge” og eliminerede behovet for gentagne prompts, sky‑baserede tilstandslagre eller dyre API‑kald. Hvorfor det betyder noget, er to‑foldigt. For det første har Claude Codes styrke — dens evne til at generere og refaktorere kode i realtid — været hæmmet af modellens statsløshed; hver ny session starter med en blank tavle, hvilket tvinger udviklere til at genoprette kontekst. Ved at gemme prompts, filstrukturer og design‑begrundelser lokalt reducerer Waypath friktionen og nedbringer token‑forbruget, hvilket giver hurtigere iterationer og lavere omkostninger. For det andet er løsningen fuldstændig offline, hvilket imødekommer voksende bekymringer omkring dataprivatliv og regulatorisk overholdelse i nordiske virksomheder, der er tilbageholdende med at sende proprietær kode til eksterne servere. Tilgangen omgår også “semantic memory ceiling”, som beskrevet i nyere mem0.ai‑forskning, ved at tilbyde et deterministisk, forespørgbart lager, der kan versionsstyres sammen med kildekoden. Det, man skal holde øje med fremover, er om Anthropic eller andre AI‑kodningsleverandører adopterer en lignende arkitektur. Fællesskabet eksperimenterer allerede med plug‑in‑hukommelseslag — Claude Design og den seneste Claude Opus 4.7‑prisskift antyder et bredere skub mod at monetisere eller forbedre kontekst‑håndtering. Benchmark‑resultater fra Waypath‑repoen, integration med CI‑pipelines og enhver officiel respons fra Anthropic vil indikere, om lokal‑først hukommelse bliver en ny standard for udvikler‑centrerede AI‑værktøjer.

Dev.to — https://dev.to/thestack_ai/claude-code-forgot-my-architecture-3-times-last-week- www.linkedin.com — https://www.linkedin.com/pulse/claude-code-forgets-everything-heres-how-i-fixed- code.claude.com — https://code.claude.com/docs/en/troubleshooting mem0.ai — https://mem0.ai/blog/how-memory-works-in-claude-code askpatrick.co — https://askpatrick.co/blog/claude-code-prompts

108

Bedste praksis for brug af Claude Opus 4.7 med Claude Code

HN +6 kilder hn

claude

Anthropic har netop offentliggjort en detaljeret vejledning i, hvordan man kombinerer deres nyeste sprogmodel, Claude Opus 4.7, med Claude Code‑udvidelsen, som driver AI‑assisteret udvikling i Visual Studio Code og andre IDE'er. Dokumentet “Bedste praksis for brug af Claude Opus 4.7 med Claude Code” uddyber modellens score på over 80 procent i SWE‑bench og understreger, at den nye versions større kontekstvindue stadig fyldes hurtigt, og at ydeevnen falder markant, når det sker. Vejledningen, der blev udgivet sammen med modellens udrulning tidligere på ugen, råder udviklere til at holde prompts under 8 k tokens, at opdele store kodebaser i logiske moduler og at bruge Claude Codes “inkrementelle forslag”-tilstand til trin‑for‑trin‑refaktorering. Den anbefaler også at udnytte udvidelsens indbyggede token‑forbrugs‑dashboard til at overvåge omkostninger og at deaktivere baggrundsanalyse på filer, der sjældent redigeres – en justering, der kan reducere latenstid med op til 30 procent. Disse taktikker afspejler de begr

HN — https://claude.com/blog/best-practices-for-using-claude-opus-4-7-with-claude-cod code.claude.com — https://code.claude.com/docs/en/best-practices www.geeky-gadgets.com — https://www.geeky-gadgets.com/claude-code-advanced-features-guide/ www.geeky-gadgets.com — https://www.geeky-gadgets.com/master-claude-code-in-8-steps/ aitoolanalysis.com — https://aitoolanalysis.com/claude-code/ www.macrumors.com — https://www.macrumors.com/2025/05/22/anthropic-launches-claude-4/

97

Claude Opus 4.7 lanceres, Qwen 3.6-35B bliver open source, og Claude Code‑workflow

Dev.to +7 kilder dev.to

agentsbenchmarksclaudegpuopen-sourceqwentraining

Anthropic har denne uge lanceret Claude Opus 4.7 og stiller den som den mest kapable version af deres flagskibsmodel indtil nu. Opgraderingen tilføjer en 30 % forøgelse af ræsonnementshastigheden, udvidet værktøjsbrug – herunder realtidswebbrowsing og kodeeksekvering – samt strammere sikkerhedsforanstaltninger. Prisen er steget, hvilket afspe

Dev.to — https://dev.to/soytuber/claude-opus-47-debuts-qwen-36-35b-open-source-claude-cod qwen-ai.com — https://qwen-ai.com/qwen-3-5/ www.latent.space — https://www.latent.space/p/ainews-every-lab-serious-enough-about deadstack.net — https://deadstack.net/tag/ml dentro.de — https://dentro.de/ai/news/ ethanbholland.com — https://ethanbholland.com/2025/09/20/ai-news-103-week-ending-september-19-2025-w Mastodon — https://noc.social/@fatherlinux/116421348671814573

94

Washingtons hastige jagt på Mythos, Anthropics kraftfulde nye model

Mastodon +6 kilder mastodon

anthropicclaude

Anthropic præsenterede en forhåndsvisning af Claude Mythos tirsdag og positionerede modellen som den mest avancerede AI til cybersikkerhedsforskning, der nogensinde er udgivet. Firmaet sagde, at Mythos kan dissekere softwarekode, identificere zero‑day‑fejl og endda generere udnyttelsesscripts med en hastighed, der overgår menneskelige analytikere. Adgangen er begrænset til en “lille kreds af partnerorganisationer”, en liste der omfatter flere amerikanske føderale agenturer, som er ivrige efter at teste teknologien på trods af et vedvarende administrativt forbud mod Anthropic‑kontrakter, der går tilbage til Trump‑administrationen. Meddelelsen kommer efter ugers spekulationer efter Anthropics Claude Opus 4.7‑modelkort, som vi dækkede den 16. april. Mythos bygger på Opus' sprogkapaciteter, men tilføjer et dybt, målrettet resonneringslag, der gør det i stand til at udforske kodebaser med en “bestemthed for at nå sine mål”, som forsk

Mastodon — https://www.nytimes.com/2026/04/17/business/dealbook/washington-anthropic-mythos www.linkedin.com — https://www.linkedin.com/posts/bloomberg-news_the-ai-model-that-frightens-wall-s www.politico.com — https://www.politico.com/news/2026/04/14/anthropic-mythos-federal-agency-testing techcrunch.com — https://techcrunch.com/2026/04/07/anthropic-mythos-ai-model-preview-security/ www.fastcompany.com — https://www.fastcompany.com/91524611/anthropic-claude-mythos-glasswing HN — https://www.ft.com/content/c9f5b690-a10e-4c66-9245-017f8bfbc7b4

93

TechCrunch: Anthropic lancerer Claude Design, et nyt produkt til at skabe hurtige visuelle elementer

Mastodon +7 kilder mastodon

anthropicclaude

Anthropic præsenterede Claude Design fredag og tilføjede et lag til visuel oprettelse til sin Claude-familie af store sprogmodeller. Den eksperimentelle tjeneste gør det muligt for brugere at beskrive en prototype, en præsentation, et én‑sides dokument eller et andet grafisk element i almindelig tekst og modtage et fuldt gengivet udkast, som kan finjusteres ved at kommentere på specifikke elementer eller ved at tegne direkte på lærredet. Claude itererer derefter i realtid og tilbyder skydeknapper til farve, skrifttype, layout og andre parametre uden behov for et separat designværktøj. Lanceringen markerer Anthropics første indtog på design‑automatiseringsmarkedet og positionerer Claude Design som en direkte konkurrent til Figma, Canva og nye AI‑drevne visuelle redaktører. Ved at udnytte Claudes multimodale ræsonnement lover produktet at reducere den tid, der kræves til mock‑ups og marketingmateriale, fra timer til minutter – et løfte, der potentielt kan omforme arbejdsprocesserne for produktteams, startups og freelance‑designere. Som vi rapporterede den 17. april, har Anthropics seneste opgradering, Claude Opus 4.7, allerede øget modellens ræsonneringsdybde og omkostninger pr. session; Claude Design udvider denne kapacitet til den visuelle domæne og tyder på, at virksomheden satser på en samlet tekst‑og‑billed‑AI‑stack. Claude Design rulles gradvist ud til eksisterende Claude‑brugere med en web‑grænseflade, der integrerer et enkelt tegne‑overlag og en chat‑baseret feedback‑sløjfe. Priserne er endnu ikke offentliggjort, men Anthropic vil sandsynligvis pakke produktet sammen med sine nuværende abonnementsniveauer, i overensstemmelse med prisstrategien for de seneste udgivelser. Hvad man skal holde øje med: Adoptionsmålinger fra den tidlige adgangs‑kohorte vil afsløre, om designere omfavner den samtalebaserede tilgang frem for traditionelle træk‑og‑slip‑værktøjer. Integration med Anthropics API kan gøre det muligt for tredjepartsplatforme at indlejre designgenerering, mens konkurrenter som OpenAI og Stability AI forventes at accelerere deres egne visuelle genererings‑tilbud. De kommende måneder vil afgøre, om Claude Design bliver en niche‑prototypegenerator eller en mainstream design‑arbejshest.

Mastodon — https://rbfirehose.com/2026/04/17/techcrunch-anthropic-launches-claude-design-a- techcrunch.com — https://techcrunch.com/2026/04/17/anthropic-launches-claude-design-a-new-product thenewstack.io — https://thenewstack.io/anthropic-claude-design-launch/ mezha.net — https://mezha.net/eng/bukvy/anthropic_launches_claude/ qz.com — https://qz.com/anthropic-claude-design-slides-prototypes-041726 www.investing.com — https://www.investing.com/news/company-news/anthropic-launches-claude-design-for Mastodon — https://fed.brid.gy/r/https://bsky.app/profile/did:plc:rmqahs4r3ogkejvkixv37epu/

86

GitHub - forrestchang/andrej-karpathy-skills: En enkelt CLAUDE.md‑fil til at forbedre Claude Code‑adfærd, afledt af Andrej Karpathy’s observationer om LLM‑kodningsfælder.

Mastodon +6 kilder mastodon

agentsclaude

Et nyt GitHub‑arkiv, der blev udgivet den 1. februar 2026, indeholder en enkelt “CLAUDE.md”-fil, som kodificerer Andrej Karpathy’s observationer om de mest almindelige faldgruber ved kodning med store sprogmodeller. Filen, skrevet af Forrest Chang, destillerer Karpathy’s indsigter i fire operationelle principper — Think Before Coding, Verify Assumptions, Test Incrementally og Guard Against Hallucination — og indlejrer dem som påkrævede prompts til Claude Code‑agenter. Arkivet leverer også eksempler på prompts, en “skills”-mappe, der knytter hvert princip til konkrete Claude Code‑konfigurationer, samt en issue‑tracker, hvor tidlige brugere kan dele justeringer. Bidraget er vigtigt, fordi Claude Code, Anthropic’s svar på GitHub Copilot, er blevet et foretrukket værktøj for nordiske udviklere, der bygger AI‑forstærkede pipelines. Som vi rapporterede den 17. april 2026 i artiklen “Best practices for using Claude Opus 4.7 with Claude Code”, er prompt‑engineering den primære håndtag for at styre LLM‑adfærd, men mange teams benytter stadig ad‑hoc‑instruktioner, der fører til over‑selvsikre forslag, oversete kant‑cases og dyre fejlfindingscyklusser. Ved at samle Karpathy’s lektioner i en enkelt, versionsstyret markdown‑fil giver repoet ingeniører en gentagelig, fællesskabs‑valideret baseline, som kan indarbejdes i enhver Claude Code‑arbejdsgang, og som potentielt kan reducere fejlprocenter og spild af beregningsressourcer. Det, der skal holdes øje med fremover, er om Anthropic integrerer CLAUDE.md‑konventionerne i sin officielle dokumentation eller sine værktøjer. Tidlige tegn — issues i repoet peger allerede på integration med “claude‑mem”‑hukommelseslaget, som blev omtalt i vores artikel den 17. april om vedvarende hukommelse — kan udløse et bredere økosystem af delte prompt‑biblioteker. Opfølgende benchmark‑resultater fra nordiske AI‑laboratorier vil vise, om retningslinjerne omsættes til målbare produktivitetsgevinster, og en eventuel fork for andre LLM‑kodningsassistenter kunne gøre denne beskedne markdown‑fil til en de‑facto‑standard for sikker, effektiv AI‑assisteret udvikling.

Mastodon — https://infosec.exchange/@hasamba/116419410869316086 github.com — https://github.com/forrestchang/andrej-karpathy-skills github.com — https://github.com/forrestchang/andrej-karpathy-skills/blob/main/CLAUDE.md github.com — https://github.com/forrestchang/andrej-karpathy-skills/tree/main/skills/karpathy github.com — https://github.com/forrestchang/andrej-karpathy-skills/issues github.com — https://github.com/forrestchang/andrej-karpathy-skills/blob/main/EXAMPLES.md

84

Claude Opus 4.7 ødelagde min pipeline – så fik jeg den repareret

Dev.to +6 kilder dev.to

claudegemini

Anthropics seneste opgradering til Claude Opus 4.7 har afsløret en skjult faldgrube: modellens nye tokenizer omformer stiltiende token‑grænser, hvilket får pipelines, der kørte fejlfrit på 4.6, til at ramme uventede begrænsninger. Problemet dukkede op, da udviklere, der bruger Claude Code‑drevet automatisering, bemærkede pludselige “token‑limit exceeded”-fejl i builds, som tidligere holdt sig komfortabelt under loftet på 100 k‑tokens. Den grundlæggende årsag er et skift fra det ældre BPE‑ordforråd til et større, mere granulært token‑sæt, designet til at forbedre flersprogs‑håndtering og reducere hallucinationer. Selvom ændringen løfter resultaterne på resonnerings‑ og kodegenererings‑benchmarks — noget vi fremhævede i vores dækning den 16. april “Introducing Claude Opus 4.7” — betyder det også, at strenge med understregninger, camel‑case‑identifikatorer eller visse mellemrumsmønstre nu forbruger flere tokens. Pipelines, der hardkodede 4.6‑token‑tællingen, eller som stolede på Claude Codes token‑offset‑beregninger, overskrider pludselig grænsen, hvilket udløser fejl i CI/CD‑stadier, automatiserede refaktorering‑agenter og endda i Spice‑simulation‑til‑oscilloskop‑verifikationsflowet, vi udforskede den 17. april. Løsninger cirkulerer allerede. Anthropic udgav et kompatibilitetsflag ( --legacy‑tokenizer ) i 4.7.1‑patchen, så teams kan vende tilbage til den tidligere token‑map, mens de bevarer modellens kerneforbedringer. En mere bæredygtig tilgang er at integrere den opdaterede tokenizer‑bibliotek i build‑trinnet og genberegne token‑budgetterne med Claude Codes indbyggede estimator, som nu rapporterer token‑forbrug i realtid. Rohan Prasads “Claude Code Handbook” anbefaler allerede dynamiske token‑tjek, en praksis der nu fremstår som uundværlig. Hvad du skal holde øje med: Anthropic har antydet en “token‑stable” udrulning i kommende udgivelser, og fællesskabet bygger wrapper‑værktøjer, der automatisk justerer prompts baseret på den nye token‑kalkulation. Hold øje med de kommende Opus 4.7.2‑patch‑noter og på GitHub‑repos, der udgiver migrations‑scripts — tidlig adoption vil spare teams for den kostbare pipeline‑nedetid, som denne opgradering i første omgang forårsagede.

Dev.to — https://dev.to/alanwest/migrating-to-claude-opus-47-broke-my-pipeline-heres-how- news.smol.ai — https://news.smol.ai/issues/2026-02-17-sonnet-46 www.morphllm.com — https://www.morphllm.com/best-ai-model-for-coding www.rohanprasad.dev — https://www.rohanprasad.dev/claude-handbook/ thecreatorsai.com — https://thecreatorsai.com/p/claude-1-on-app-store-gpt-54-lands vadim.blog — https://vadim.blog/code-improver-research-to-practice

84

Show HN: SPICE‑simulering → oscilloskop → verifikation med Claude Code

HN +6 kilder hn

claudeopen-source

Et indlæg på Hacker News i denne uge placerede Claude Code i forreste række som en praktisk assistent for analoge designere. Forfatteren uploadede en notebook, der starter med en SPICE‑netliste, sender den til en open‑source‑simulator, gengiver de resulterende bølgeformer som et oscilloskop‑spor, og derefter beder Claude Code om at verificere, at den simulerede opførsel stemmer overens med designintentionen. AI’en genererede ikke kun SPICE‑koden ud fra en høj‑niveau beskrivelse af et lavpasfilter, men skrev også det Python‑“lim”, der starter ngspice, udtrækker spændingsdataene og plotter dem med Matplotlib i en stil, der efterligner et virkeligt oscilloskop. Når plottet er fremstillet, stilles et opfølgende prompt, der beder Claude om at sammenligne den målte opstigningstid med den ønskede specifikation, og modellen leverer en kortfattet bestået/ikke‑bestået‑vurdering med foreslåede justeringer. Hvorfor det er vigtigt, er tofoldigt. For det første demonstrerer det, at store‑sprog‑model‑kodningsassistenter er kommet ud over rene software‑opgaver og pålideligt kan orkestrere den fulde simulerings‑verifikations‑sløjfe, som traditionelt har krævet specialiserede EDA‑værktøjer såsom LTspice, PSpice eller KiCads ngspice‑integration. For det andet er arbejdsflowet fuldt reproducerbart og kan køre på en bærbar computer, hvilket sænker barrieren for små teams og hobbyister til at anvende streng verifikation uden at skulle købe dyre licenser. Som vi rapporterede den 16. april, har Claude Code allerede vist sin værdi i et produkt‑migrationsscenario; denne nye demonstration udvider dens rækkevidde til den analoge domæne, en sektor hvor AI‑assistance har været langsommere at dukke op. Det, der skal holdes øje med fremover, er om Anthropic vil udgive dedikerede plugins til populære kredsløbs‑designmiljøer eller åbne et API, der lader CAD‑leverandører integrere Claude Code direkte i skematisk‑editorer. Konkurrenterne vil sandsynligvis følge trop, og den næste runde af benchmark‑udgivelser for Claude Opus 4.7 kan indeholde hardware‑design‑test‑suiter. Hvis fællesskabet tager dette mønster til sig, kan AI‑drevet verifikation blive et standardtrin i designflowet og omforme, hvordan nordiske hardware‑startups itererer på silicium.

HN — https://lucasgerads.com/blog/lecroy-mcp-spice-demo/ www.ni.com — https://www.ni.com/en/shop/electronic-test-instrumentation/application-software- www.kicad.org — https://www.kicad.org/discover/spice/ www.analog.com — https://www.analog.com/en/resources/design-tools-and-calculators/ltspice-simulat www.cadence.com — https://www.cadence.com/en_US/home/tools/pcb-design-and-analysis/analog-mixed-si www.eevblog.com — https://www.eevblog.com/forum/blog/eevblog-1445-how-to-simulate-an-oscilloscope-

83

🧠 Claude Opus 4.7 går i GA: bedre kodning og vision, samme pris. 🧠 Codex udvider til browser‑gennemgang

HN +5 kilder hn

claudeqwen

Simon Willisons seneste blogindlæg viser et markant skifte i landskabet for AI‑genereret kunst: Da han kørte den open‑source Qwen 3.6‑35B‑A3B‑model på en almindelig laptop, producerede den en pelikanillustration, som han vurderede som bedre end den, der blev fremstillet af Anthropics Claude Opus 4.7. Sammenligningen, som blev offentliggjort den 16 april 2026, stiller Qwens multimodale evner – nu finjusteret til billedsyntese – op imod den nyudgivne version 4.7 af Claude, som vi dækkede i “What’s new in Claude Opus 4.7” (16 april 2026). Willisons eksperiment er mere end en kuriositet. Qwen 3.6‑35B‑A3B, den seneste tilføjelse til Alibabas Qwen‑serie, kan køre på forbruger‑grade GPU‑er takket være aggressiv kvantisering og A3B‑inference‑motoren. Til sammenligning forbliver Claude Opus 4.7 en cloud‑baseret tjeneste, der opkræver per token og kræver en internet‑rundtur for hver forespørgsel. Evnen til at generere høj‑kvalitets‑visuals lokalt reducerer latenstid, eliminerer risici for data‑exfiltration og sænker driftsomkostningerne for udviklere og små studier. Resultatet har betydning for det nordiske AI‑økosystem, hvor mange startups opererer med stramme budgetter og strenge dataprivatlivsregler. Hvis en model med 35 milliarder parametre kan overgå en premium‑API på en laptop, vokser incitamentet til at adoptere open‑source‑alternativer. Det lægger også pres på proprietære leverandører om at retfærdiggøre deres prisfastsættelse eller accelerere udgivelsen af nye funktioner. Hvad man skal holde øje med: Alibaba planlægger en Qwen 4.x‑serie med større vision‑language‑modeller, mens fællesskabet allerede integrerer Qwen i rammer som Chartroom og Datasette, som de seneste pakke‑udgivelser viser. Anthropic kan svare med tættere integration af billedgenerering eller reviderede pris‑tier‑strukturer. Samtidig vil benchmark‑suiter, der sammenligner multimodal output‑kvalitet på tværs af open‑source‑ og kommercielle modeller, sandsynligvis få større gennemslagskraft og give udviklere konkrete data til fremtidige migrationer. Pelikantesten er måske en lille anekdote, men den forudser en bredere ombalancering af magtforholdet mellem cloud‑bundne AI‑tjenester og lokalt kørende, open‑source‑alternativer.

HN — https://simonwillison.net/2026/Apr/16/qwen-beats-opus/ simonwillison.net — https://simonwillison.net/2026/Feb/14/chartroom/ simonwillison.net — https://simonwillison.net/2025/Nov/3/datasette-search-all/ simonwillison.net — https://simonwillison.net/2026/Mar/17/llm/ simonwillison.net — https://simonwillison.net/2022/Feb/9/datasette-auth-passwords/

73

Censure er en symbolsk skue, mange beskidte hænder snupper Sam’s svindel #openai #aifraud RE: https://bsky

Mastodon +7 kilder mastodon

openai

En bølge af online fordømmelse er brudt ud omkring OpenAI‑chefen Sam Altman, efter en undersøgelse i The New Yorker offentliggjort i december 2025 afslørede interne notater, der antydede, at virksomheden overvejede at auktionere avancerede modeller til regeringer, og at Altman havde jaget “hundredevis af milliarder af dollars” fra udenlandske kilder. Eksponeringen, baseret på mere end hundrede interviews, genantændte kritikken af Altmans forretningspraksis og udløste et kortfattet indlæg på Bluesky, som kaldte censuren “en symbolsk skue” og anklagede “mange beskidte hænder” for at snuppe Altmans “svindel”. Bluesky‑beskeden, forstærket af hashtagsene #openai og #aifraud, faldt sammen med to retlige frontlinjer, der allerede har sat Altman under pres. Tidligere på ugen indgav han en anmodning om afvisning af erstatningskrav for strafskade i en retssag anlagt af hans søster, som påstår seksuelt misbrug; Altman søger kun en symbolsk erstatning på 1 $, idet han argumenterer for, at han ikke har til hensigt at forvolde økonomisk skade, men ønsker en domstolsdeklaration om, at anklagerne er falske. Samtidig er en separat sag, anlagt af Elon Musk, sat til retssag den 27. april, hvor OpenAI beskyldes for at have afveget fra sin oprindelige mission og vildledt Musks tidlige investering. Baggrunden for den offentlige modreaktion er vigtig, fordi den samler omdømme‑, juridiske‑ og geopolitiske bekymringer, som kan omforme OpenAIs position over for investorer, regulatorer og udenlandske regeringer. Hvis domstolene afviser Altmans strategi med symbolsk erstatning, kan virksomheden stå over for betydelige økonomiske eksponeringer, mens en dom i Musks sag, der er ugunstig for OpenAI, vil styrke krav om strengere tilsyn med AI‑virksomheder, der modtager offentlige kontrakter – et tema vi fremhævede den 17. april, da vi rapporterede om Googles forhandlinger med Pentagon om specialdesignede AI‑chips. Hold øje med udfaldet af Musks retssag, domstolens afgørelse i søstersagen og eventuelle formelle svar fra OpenAIs bestyrelse. En afgørende dom kan udløse aktioner fra aktionærer, indføre nye compliance‑foranstaltninger eller fremskynde lovgivningsforslag, der sigter mod at begrænse uigennemsigtige AI‑teknologihandler.

Mastodon — https://fed.brid.gy/r/https://bsky.app/profile/did:plc:osg2vzhifd2tjfsvfwua7scy/ www.reddit.com — https://www.reddit.com/r/OpenAI/comments/1pqqhwq/sam_altman_is_a_fraud_throughou www.storyboard18.com — https://www.storyboard18.com/amp/brand-makers/openai-chief-sam-altman-seeks-dism www.reddit.com — https://www.reddit.com/r/OpenAI/comments/1sfbjjn/sam_altman_tries_fails_to_distr futurism.com — https://futurism.com/artificial-intelligence/sam-altman-smut-response www.newyorker.com — https://www.newyorker.com/podcast/the-new-yorker-radio-hour/sam-altmans-trust-is Mastodon — https://fed.brid.gy/r/https://bsky.app/profile/did:plc:fzuv4ykidahyj5vr5p6n44yz/

72

Bedste AI‑gateway‑værktøjer i 2026 til skalerbare LLM‑applikationer

Dev.to +5 kilder dev.to

anthropicgoogleopenai

Et nyt sammenlignende vejledningsdokument, udgivet den 17. april af Lightning Developer, rangerer de otte mest kapable AI‑gateway‑platforme for 2026 og placerer dem som essentiel infrastruktur for ethvert team, der ønsker at bevæge sig ud over “én app, én API, én model”-tilgangen med direkte kald til OpenAI, Anthropic eller Google. Vejledningen vurderer Bifrost, TrueFoundry, Inworld Router, OpenRouter, LiteLLM, Helicone, Portkey, Braintrust og Vercel AI Gateway på latency, omkostninger, governance, deploymentsmodel og integrationsvenlighed, og leverer klar‑til‑kørsel kode‑snippets for hver. Stigningen i antallet af LLM‑udbydere og den voksende diversitet i modelfamilier har gjort rå API‑kald til en flaskehals for skalerbarhed, sikkerhed og compliance. Gateways fungerer som en enkelt façade, der router anmodninger, håndhæver politikker, aggregerer forbrugsdata og kan cache svar — funktioner, der direkte adresserer de omkostningsinflations‑ og latency‑udfordringer, vi fremhævede i vores stykker den 17. april om llm‑cache og sub‑cent‑per‑call OpenRouter‑brug. Ved at abstrahere udbyderspecifikke detaljer muliggør gateways også hurtig model‑udskiftning, multi‑tenant fakturering og revisionsspor, som bliver uundværlige for virksomheder, der implementerer mission‑kritisk AI. Set fremad ser det ud til, at markedet vil samle sig omkring standarder for observabilitet og politik‑håndhævelse, såsom den fremvoksende OpenAI‑kompatible routing‑spec og ensartede token‑metering‑API’er. Leverandører tilføjer allerede indbyggede prompt‑caching‑lag og AI‑Ops‑dashboards, så den næste bølge af gateways vil udviske grænsen mellem proxy og fuld‑stack MLOps‑platform. Hold øje med tættere integration med cloud‑native service meshes, fremkomsten af selv‑hostede open‑source‑muligheder som Bifrost, der får enterprise‑support, samt potentiel konsolidering, når større cloud‑spillere opkøber niche‑routere. Vejledningen giver en rettidig køreplan for udviklere og beslutningstagere, der navigerer i denne hastigt udviklende stack.

Dev.to — https://dev.to/lightningdev123/best-ai-gateway-tools-in-2026-for-scalable-llm-ap www.getmaxim.ai — https://www.getmaxim.ai/articles/best-llm-gateways-in-2026/ www.truefoundry.com — https://www.truefoundry.com/blog/best-llm-gateways inworld.ai — https://inworld.ai/resources/best-llm-gateways techsy.io — https://techsy.io/blog/best-llm-gateway-tools

72

Vi gengav Anthropics Mythos‑resultater med offentlige modeller

HN +6 kilder hn

agentsanthropicopen-source

Anthropics interne cybersikkerhedsmodel, Claude Mythos, har været genstand for intens granskning, siden virksomheden begyndte at begrænse adgangen til den for kun en håndfuld partnere, herunder amerikanske myndigheder. Tidligere på ugen annoncerede et team af uafhængige forskere, at de havde replikeret Mythos’ mest citerede sårbarheds‑detekteringsresultater ved udelukkende at bruge offentligt tilgængelige, open‑source‑modeller. Replikationsarbejdet byggede på “Open‑Source for Anthropic”-programmet, som lader udviklere eksperimentere med Mythos under en fortrolighedsaftale. Ved at træne mindre, offentligt udgivne transformer‑agenter på de samme kode‑base‑benchmark‑sæt, som Anthropic anvendte, identificerede forskerne hundreder af de samme fejl, som Mythos markerede, omend med en lavere succesrate. Deres papir, som blev lagt på en pre‑print‑server, bemærker, at selvom de offentlige modeller gik glip af en brøkdel af de mest obskure problemer, så fangede de størstedelen af de højt‑severe fund, som Anthropic fremhævede i sit interne white‑paper. Hvorfor det betyder noget, er todelt. For det første er påstanden om, at Mythos giver en proprietær fordel i automatiseret sikkerhedstestning, nu tempereret; open‑source‑alternativer kan opnå sammenlignelig dækning uden de høje API‑gebyrer, som Anthropic har antydet kan løbe op i tusinder af dollars om måneden. For det andet omformer resultatet den politiske debat, der udfoldede sig i april, da Det Hvide Hus annoncerede planer om at give føderale agenturer adgang til Mythos (se vores dækning fra 17. april af “Mythos‑kaosset”). Hvis offentlige institutioner kan stole på fællesskabs‑drevne værktøjer, intensiveres presset på Anthropic for at åbne deres model — eller risikere at blive overhalet af konkurrenterne. Hvad man skal holde øje med fremover: Anthropic forventes at svare med en teknisk redegørelse, der forsvarer Mythos’ unikke kapaciteter, og virksomheden kan justere sin licensmodel for at bevare den kommercielle fordel. Samtidig vil cybersikkerhedsfirmaer og nationale laboratorier sandsynligvis iværksætte bredere benchmark‑initiativer for at kortlægge præstationsgabet mellem proprietære og open‑source AI‑revisorer. De kommende uger kan afgøre, om Mythos forbliver en niche‑ressource eller bliver en katalysator for et mere åbent AI‑drevet sikkerhedsøkosystem.

HN — https://blog.vidocsecurity.com/blog/we-reproduced-anthropics-mythos-findings-wit discuss.privacyguides.net — https://discuss.privacyguides.net/t/exclusive-anthropic-is-testing-mythos-its-mo www.aicerts.ai — https://www.aicerts.ai/news/unpacking-the-mythos-model-controversy-debate/ gizmodo.com — https://gizmodo.com/anthropic-launches-project-glasswing-to-stealthily-spot-cybe arstechnica.com — https://arstechnica.com/civis/threads/anthropic-limits-access-to-mythos-its-new- alt-hn.vercel.app — https://alt-hn.vercel.app/item/47732020

67

OpenAI begynder at tilbyde en biologi‑tilpasset LLM

Mastodon +7 kilder mastodon

appleopenai

OpenAI meddelte torsdag, at de nu tilbyder GPT‑Rosalind, en stor sprogmodel, der er specifikt tilpasset biologisk forskning. Modellen, opkaldt efter den banebrydende krystallograf Rosalind Franklin, er blevet trænet på halvtreds af de mest almindelige livsvidenskabelige arbejdsgange og er forbundet med store offentlige databaser såsom UniProt, PDB og Ensembl. I lukket‑adgangstilstand kan GPT‑Rosalind foreslå plausible metaboliske veje, rangere potentielle lægemiddelmål og forudsige strukturelle eller funktionelle egenskaber ved proteiner, hvilket effektivt omdanner naturlige sprog‑prompt til handlingsorienterede forskningshypoteser. Lanceringen bygger på den livsvidenskabelige model, som OpenAI afslørede den 17. april, og som vi dækkede i vores rapport om virksomhedens nye AI til livsvidenskabelig forskning. I modsætning til den bredere løsning

Mastodon — https://mastodon.crazynewworld.net/@hans/116417319633684165 arstechnica.com — https://arstechnica.com/science/2026/04/openai-starts-offering-a-biology-tuned-l letsdatascience.com — https://letsdatascience.com/news/openai-launches-gpt-rosalind-a-biology-tuned-ll www.thetechstreetnow.com — https://www.thetechstreetnow.com/tech/openai-starts-offering-a-biology-tuned-llm germanic.news — https://germanic.news/openai-unveils-gpt-rosalind-biology-tuned-llm-for-research openai.com — https://openai.com/index/preparing-for-future-ai-capabilities-in-biology/ Mastodon — https://c.im/@arstechnica/116416626209628859

66

Scan din hjemmeside for at se, hvor klar den er til AI‑agenter

HN +6 kilder hn

agentsclaudeperplexity

Et nyt gratis værktøj, der scanner en hjemmeside for “AI‑agent‑klarhed”, gik i drift i denne uge og lover øjeblikkelig, handlingsorienteret feedback på, hvor godt et site kan læses, forstås og anbefales af store sprogmodel‑agenter som ChatGPT, Claude eller Perplexity. Scanneren udfører 17 automatiserede tjek på tværs af fem kategorier – indholdsstruktur, metadata, navigation, tilgængelighed og sikkerhed – og leverer en samlet “Agent‑Readiness”‑score samt en kort tjekliste med rettelser. Tjenesten kommer på et tidspunkt, hvor autonome web‑agenter bevæger sig ud over simpel crawling for at udføre nuancerede opgaver: sammenfatte produktsider, besvare brugerforespørgsler i realtid og endda gennemføre transaktioner på vegne af shoppere. Som vi rapporterede den 17. april, træner benchmarks som RiskWebWorld og WebXSkill allerede agenter i at navigere i e‑commerce‑sites og lære nye web‑baserede færdigheder. Et site, der ikke udsender ren, semantisk rig data, risikerer at blive marginaliseret af disse agenter, hvilket kan betyde tabt trafik, lavere konverteringsrater og nedsat synlighed i de fremvoksende AI‑drevne søgeresultater. For virksomheder tilbyder scanneren en lav‑omkostningsmulighed for at revidere deres digitale indgangsport, før AI‑agenter bliver en dominerende opdagelseskanal. Tidlige brugere kan benytte anbefalingerne til at omstrukturere HTML‑overskrifter, tilføje schema‑markup, forbedre intern linking og stramme bot‑venlige sikkerhedshoveder – trin, der også gavner traditionel SEO. Den bredere implikation er et skift i weboptimeringsstandarder: hvor fokus tidligere var på menneskelæsbart indhold, er den næste frontmaskine‑læsbart formål. Det, der skal holdes øje med, er hvordan søgeplatforme og AI‑udbydere formaliserer “agent‑venlige” retningslinjer, og om scoren bliver et rangeringssignal. Brancheobservatører forventer, at cloud‑udbydere indlejrer lignende tjek i hosting‑dashboards, mens regulatorer kan granske gennemsigtigheden i AI‑drevne indholdsanbefalinger. Følg opdateringer fra Cloudflare, som for nylig præsenterede deres egen dokumentation som den mest “agent‑venlige” på nettet, samt eventuelle partnerskabsaftaler, der kan gøre scanneren til en de‑facto certificering for AI‑klare sites.

HN — https://isitagentready.com www.agentready.tools — https://www.agentready.tools/ isagentready.com — https://isagentready.com/ blog.cloudflare.com — https://blog.cloudflare.com/agent-readiness/ www.webmcpready.com — https://www.webmcpready.com/ scoreforai.com — https://scoreforai.com/

65

Det Hvide Hus vil give amerikanske myndigheder adgang til Anthropic Mythos, rapporterer Bloomberg News

HN +7 kilder hn

anthropic

Det Hvide Hus forbereder en regeringsomfattende version af Anthropics frontløbende model Mythos, rapporterer Bloomberg, efter et internt notat, som nyhedsmediet har fået fat i, afslørede, at AI’en vil blive gjort tilgængelig for en udvalgt gruppe af føderale agenturer til defensivt cybersikkerhedsarbejde. Udrulningen, kaldet “Project Glasswing”, vil give adgang til en forhåndsvisning af Claude Mythos, den model Anthropic præsenterede i begyndelsen af april som deres mest kapable system til dato. Initiativet markerer den første storskala føderale adoption af et generativ‑AI‑værktøj fra den private sektor, der kan måle sig med OpenAIs nyeste tilbud. Som vi rapporterede den 17. april, understregede Washingtons hastige jagt på Anthropic’s Mythos administrationens presserende behov for at udnytte banebrydende AI til national sikkerhed, samtidig med at man kæmper med modellens potentielle sårbarheder. Ved at kanalisere Mythos ind i agenturer som Department of Homeland Security, Cybersecurity and Infrastructure Security Agency og Office of the Director of National Intelligence, håber embedsmændene at automatisere trussels‑intelligensanalyse, accelerere hændelsesrespons og styrke regeringens netværk mod stadig mere sofistikerede angreb. Beslutningen er betydningsfuld af flere grunde. For det første signalerer den et skift fra ad‑hoc‑eksperimenter til en institutionaliseret AI‑kapacitet inden for den føderale apparat, hvilket rejser spørgsmål om indkøb, datastyring og ansvarlighed. For det andet peger notatet på en øget cybersikkerhedsrisiko: den samme model, der kan opdage skjulte udnyttelser, kan også blive brugt som våben, hvis den lækkes eller misbruges, hvilket får administrationen til at pålægge strenge sandbox‑ og revisionskrav. Endelig tester udrulningen Det Hvide Hus’ bredere AI‑strategi, som søger at balancere hurtig innovation med sikkerhedsforanstaltninger i en global kapløb om AI‑overlegenhed. Det, der skal holdes øje med fremover, er de konkrete implementeringsdetaljer – tidsplan, adgangskontroller og træningsprotokoller – som vil fremkomme fra den inter‑agentur‑task‑force, der leder Project Glasswing. Høringer i Kongressen, potentielle lovforslag om AI‑brug i regeringen og Anthropics vilje til at udvide lignende aftaler til andre offentlige partnere vil også forme, hvor hurtigt modellen bevæger sig fra pilot til produktion. De kommende uger vil vise, om Mythos kan levere det lovede sikkerhedsløft uden at åbne en ny front i nationens cyber‑risikolandskab.

HN — https://www.reuters.com/technology/white-house-give-us-agencies-anthropic-mythos www.bloomberg.com — https://www.bloomberg.com/news/articles/2026-04-16/white-house-moves-to-give-us- www.channelnewsasia.com — https://www.channelnewsasia.com/business/white-house-give-us-agencies-anthropic- thecompositeeye.com — https://thecompositeeye.com/white-house-moves-to-give-us-agencies-anthropic-myth economictimes.indiatimes.com — https://economictimes.indiatimes.com/tech/artificial-intelligence/white-house-to news.google.com — https://news.google.com/stories/CAAqNggKIjBDQklTSGpvSmMzUnZjbmt0TXpZd1NoRUtEd2l6 HN — https://www.ft.com/content/c9f5b690-a10e-4c66-9245-017f8bfbc7b4

56

Spørgsmålene bag kunstig intelligens og tilknyttede teknologier er disse: Kan vi stole på, og s

Mastodon +6 kilder mastodon

Et fælles rapport, der blev offentliggjort torsdag af det britiske parlament’s Science and Technology Committee og Centre for Data Ethics, har formuleret tre kerne‑spørgsmål, som nu dominerer AI‑debatten: kan teknologien stole på, er den bygget på systematisk tilegnelse af intellektuel ejendom, og forudsiger denne “oprindelige synd” en dybere, forstyrrende risiko. Det 112‑siders dokument, med titlen *Artificial Intelligence and the Ethics of Ownership*, bygger på vidnesbyrd fra førende akademikere, brancheledere og juridiske eksperter. Det argumenterer for, at mange store modeller trænes på ophavsretligt beskyttet materiale, som er skrabet fra internettet uden klare licenser, og dermed omdanner den kollektive produktion fra skabere til gratis data for profitdrevne AI‑virksomheder. Komitéen advarer om, at denne praksis ikke kun udhuler forfatteres økonomiske rettigheder, men også skaber en skjult afhængighed, der kan udnyttes som våben, hvis datakanalen kompromitteres. Hvorfor rapporten er vigtig, er tofoldigt. For det første udfordrer den den dominerende fortælling om, at AI’s største trussel er bias eller jobtab, og flytter fokus til de juridiske og moralske grundlag for dataleverandørkæden. For det andet signalerer den et potentielt regulatorisk skifte: komitéen anbefaler obligatorisk oprindelses‑offentliggørelse for træningsdatasæt, en lovbestemt ret for skabere til at fravælge masseindsamling af data, og en ny tilsynsmyndighed, der skal revidere store modeller for overtrædelse af IP‑rettigheder. Interessenter reagerer allerede. Storbritanniens Office for AI har lovet at konsultere om en “data‑rettighedscharter” inden for det næste kvartal, mens store AI‑udbydere har udsendt erklæringer, hvor de forsvarer deres databrugs‑politikker og lover større gennemsigtighed. I Europa forventes de forestående revisioner af AI‑loven at indarbejde strengere datastyrings‑klausuler, og USA følger nøje med, efterhånden som spørgsmålet får tværpolitisk opmærksomhed. Hvad man skal holde øje med fremover: den britiske regerings formelle svar på komitéens anbefalinger, den første runde af høringer under den reviderede AI‑lov, samt eventuelle retssager fra skabere, der søger erstatning for uautoriseret data‑brug. Resultatet vil afgøre, om AI kan implementeres ansvarligt, eller om den forbliver en omstridt grænse inden for intellektuel ejendomsret.

Mastodon — https://zirk.us/@ChrisMayLA6/116418459500680016 ixdf.org — https://ixdf.org/literature/topics/ai www.researchgate.net — https://www.researchgate.net/publication/378548410_Artificial_Intelligence_Appli inabj.org — https://inabj.org/index.php/ibj/article/view/844/0 inabj.org — https://inabj.org/index.php/ibj/article/view/844 pastebin.pl — https://pastebin.pl/view/03ac82be

51

Claude Opus skrev et Chrome‑udnyttelse for $2.283

HN +5 kilder hn

claude

Anthropic’s Claude Opus er gået fra at være en kodningsassistent til et værktøj til jagt på sårbarheder og leverede et komplet Chrome‑V8‑udnyttelse, der indbragte en bounty på $2.283. Udnyttelsen blev genereret, efter at en sikkerhedsforsker på Discord bad modellen om at målrette et bevidst forældet Chrome 138‑pakke og derefter bad den om at konstruere en fuld kæde mod den V8‑out‑of‑bounds‑læsefejl, der blev opdaget i Chrome 146 – den samme motor, som driver Anthropic’s egen Claude Desktop. Inden for få timer leverede Claude payload’en, som forskeren indsendte til Googles bug‑bounty‑program, og den blev accepteret. Episoden understreger, hvordan store sprogmodeller kan fremskynde opdagelsen af nul‑dage, som ellers ville kræve uger med manuel reverse engineering. Selvom $2.283 er beskedent sammenlignet med typiske kommercielle budgetter til exploit‑udvikling, vækker den hastighed og lave omkostning, der demonstreres her, bekymring hos både forsvarere og leverandører. Anthropic har allerede antydet intern tøven med at frigive deres “Mythos”‑bug‑findingsmodel offentligt, af frygt for at den kan give ondsindede aktører magt. Hændelsen giver derfor ekstra vægt til opfordringer om retningslinjer for ansvarlig AI‑udrulning, som adresserer forskning med dobbelt anvendelse. Som vi rapporterede den 17. april, gik Claude Opus 4.7 i generel tilgængelighed med stærkere kodnings‑ og visionsevner, men det nye udnyttelse viser, at modellens rækkevidde nu også omfatter lav‑niveau systemprogrammering. Hold øje med Anthropic’s svar: virksomheden kan stramme adgangen til sine mest kraftfulde modeller, indføre politikker for brugssikring eller rulle værktøjer ud til at opdage AI‑genereret exploit‑kode. Lige så vigtigt vil Googles reaktion være – om de fremskynder patch‑cyklusser for Chrome eller justerer deres bounty‑strukturer for at tage højde for AI‑assisterede indsendelser. Det bredere sikkerhedsfællesskab vil følge med i, hvor hurtigt andre AI‑platforme kan efterligne denne evne, og hvilke afbødningsstrategier der opstår.

HN — https://www.theregister.com/2026/04/17/claude_opus_wrote_chrome_exploit/ www.hacktron.ai — https://www.hacktron.ai/blog/i-let-claude-opus-to-write-me-a-chrome-exploit www.itsecuritynews.info — https://www.itsecuritynews.info/claude-opus-wrote-a-chrome-exploit-for-2283/ aihaberleri.org — https://aihaberleri.org/en/news/claude-opus-discovers-zero-day-chrome-exploit-fo chromeosphere.com — https://chromeosphere.com/claude-opus-wrote-a-chrome-exploit-for-2283/

50

GitHub - github/spec-kit: 💫 Værktøjssæt til at hjælpe dig i gang med specifikationsdrevet udvikling

Mastodon +7 kilder mastodon

GitHub har lanceret Spec‑Kit, et open‑source‑værktøjssæt, der placerer specifikationsdrevet udvikling (SDD) i centrum af AI‑assisteret kodning. Projektet, som nu har over 28 000 GitHub‑stjerner, samler et katalog af færdiglavede “presets” og et sæt på elleve AI‑agenter, der omsætter overordnede specifikationer til eksekverbar kode ved hjælp af Copilot, Claude Code, Gemini CLI og andre store sprogmodel‑ (LLM‑) back‑ends. Vedligeholdere vil gennemgå pull‑requests, der ændrer katalogets struktur eller overholder politikker, men de distancerer sig eksplicit fra at godkende den genererede kode selv, hvilket understreger en fællesskabsdrevet styringsmodel. Udgivelsen er vigtig, fordi den formaliserer en arbejdsproces, som mange udviklere hidtil har improviseret med ad‑hoc‑prompt. Ved at behandle specifikationer som første‑klasses artefakter lover Spec‑Kit højere konsistens, lettere auditabilitet og hurtigere onboarding for teams, der kæmper med “sløret” kode, når LLM‑er anvendes uden klare begrænsninger. Værktøjssættet falder også naturligt sammen med de seneste diskussioner om pålideligheden af Claude Code, som fremhævet i vores dækning den 17. april af Andrej Karpthys guide til kodningsfælder, samt med Anthropics nye Mythos‑model, der begge hæver indsatsen for robust, testbar AI‑genereret software. Det, man skal holde øje med fremover, er, hvor hurtigt virksomheder adopterer kataloget og bidrager med egne presets, hvilket potentielt kan forme en de‑facto‑standard for AI‑forstærkede udviklings‑pipelines. GitHub har antydet en kommende “Spec‑Kit 2.0”, som vil tilføre dybere integration med CI/CD‑systemer og rigere verifikations‑hooks. Analytikere vil også følge, om den fællesskabs‑kuraterede tilgang kan holde trit med den hurtige udvikling af LLM‑kapaciteter, især efterhånden som nye agenter fra OpenAI og Google træder ind i økosystemet. De kommende måneder bør afsløre, om Spec‑Kit kan flytte SDD fra niche‑eksperiment til mainstream‑praksis.

Mastodon — https://fosstodon.org/@preludetech/116419463017542319 github.com — https://github.com/github/spec-kit speckit.org — https://speckit.org/ github.blog — https://github.blog/ai-and-ml/generative-ai/spec-driven-development-with-ai-get- codestandup.com — https://codestandup.com/posts/2025/github-spec-kit-tutorial-intro-and-setup/ developer.microsoft.com — https://developer.microsoft.com/blog/spec-driven-development-spec-kit Mastodon — https://fosstodon.org/@sheena/116419462582455676

48

Codex til (næsten) alt

Mastodon +7 kilder mastodon

agentsopenai

OpenAI har lanceret en større opgradering af sin desktop‑baserede Codex‑agent og kalder den nye version “Codex til (næsten) alt”. Opdateringen, der blev udgivet den 16. april 2026 til macOS og Windows, udvider værktøjet ud over kodefuldførelse til fuld systeminteraktion. Codex kan nu flytte musen, skrive i enhver applikation, starte og navigere i en indbygget webbrowser, generere billeder på forespørgsel, bevare præferencer på tværs af sessioner og indlæse tredjeparts‑plugins, der automatiserer gentagne opgaver. Kort sagt er AI’en blevet gjort til en udviklingspartner, der kan orkestrere hele arbejdsflowet fra design‑mock‑ups til deployments‑scripts uden at brugeren behøver forlade IDE’en. Flytningen er vigtig, fordi den skubber konverserende agenter ind i samme territorium som Anthropic’s Claude Code og de nye “super‑app”‑agenter. Ved at håndtere UI‑handlinger og visuelle assets reducerer Codex den kontekst‑skiftning, der længe har bremset software‑teams, og lover hurtigere prototyping samt strammere DevOps‑loops. Samtidig rejser evnen til at kontrollere en computer sikkerheds‑ og privatlivsspørgsmål, som virksomheder skal tackle, før de giver modellen brede tilladelser. Som vi rapporterede den 17. april 2026, introducerede OpenAI’s tidligere Codex‑opdatering baggrunds‑computerbrug; dagens udgivelse tilføjer browsing, billedgenerering, hukommelse og en plugin‑ramme, hvilket markerer det første skridt mod en virkelig generel kodningsassistent. De næste milepæle at holde øje med er OpenAI’s planer for Linux‑support, prisstrukturen for det udvidede funktionssæt og væksten i plugin‑markedet. Lige så vigtigt vil det være, hvor hurtigt udviklingsteams adopterer værktøjet i forhold til etablerede løsninger som GitHub Copilot og Claude Code, samt om regulatorer indfører nye sikkerhedsforanstaltninger for AI‑agenter, der kan manipulere operativsystemer.

Mastodon — https://mastodon.social/@inautilo/116418130767853408 openai.com — https://openai.com/index/codex-for-almost-everything/ vibecode.morecil.ru — https://vibecode.morecil.ru/ru/новости/openai-codex-for-almost-everything/ decrypt.co — https://decrypt.co/364670/codex-computer-use-browser-image-gen-openai-super-app vibecoderz.ru — https://vibecoderz.ru/blog/openai-codex-vyshel-16-aprelya-2026 medium.com — https://medium.com/@cdcore/the-tale-of-2-models-opus-4-6-vs-gpt-5-3-codex-129fcb Mastodon — https://techhub.social/@nic221/116416780414510855

48

OpenAI‑udviklere (@OpenAIDevs) på X

Mastodon +7 kilder mastodon

openai

OpenAIs udvikler‑fokuserede X‑konto annoncerede, at Codex opgraderes fra en ren kode‑genereringsmotor til en bredere “arbejds‑assistent”, der kan hjælpe med opgaver fra udarbejdelse af dokumentation til design af test‑cases og forespørgsler om projektstyring. Indlægget, der blev delt den 17. april, præsenterer ændringen som et skridt mod at gøre modellen til et centralt produktivitets‑hub for software‑teams snarere end et niche‑tilføjelsesprogram til kodning. Flytningen bygger på udrulningen “Codex for (næsten) alt”, som blev rapporteret tidligere på ugen, og som første gang antydede modellens evne til at håndtere ikke‑kode‑prompt. Ved officielt at udvide API‑ens omfang signalerer OpenAI, at de ser udvikler‑arbejdsgange som et integreret økosystem, hvor kode, specifikationer, tickets og vidensbaser er udskiftelige input til en LLM. For ingeniører lover opgraderingen færre kontekst‑skift: en enkelt prompt kan nu generere en funktion, skrive tilhørende docstrings, foreslå enhedstests og endda udforme en kort statusopdatering til et sprint‑board. For virksomheder kan den bredere funktionalitet stramme værdiforslaget for OpenAIs platform i forhold til konkurrenter som GitHub Copilot og Microsofts egne AI‑forstærkede Visual Studio‑værktøjer. Det, man skal holde øje med fremover, er de konkrete integrationsdetaljer, som OpenAI vil offentliggøre. Virksomheden har antydet strammere IDE‑plugins, mere præcis hastighedsbegrænsning for det udvidede funktionssæt og en udvikler‑AMA planlagt til senere på måneden. Observatører vil også holde øje med prisjusteringer, især da de nye muligheder kan medføre højere token‑forbrug. Endelig kan udrulningen falde sammen med den nyligt lancerede GPT‑5.4‑Cyber‑model til cybersikkerhed og den biologi‑optimerede LLM, hvilket tyder på en strategi om at indlejre specialiseret viden i en samlet udvikler‑produktivitetspakke. De kommende uger bør afsløre, hvor hurtigt økosystemet adopterer den udvidede Codex, og om den omformer den standardiserede værktøjskæde for nordiske softwarevirksomheder.

Mastodon — https://mastodon.sayzard.org/@sayzard/116417782819111333 community.openai.com — https://community.openai.com/t/ama-with-the-openai-o1-team/939267 community.openai.com — https://community.openai.com/t/openai-dev-day-2023-live-reactions/475167?page=2 community.openai.com — https://community.openai.com/t/ama-on-the-17th-of-december-with-openais-api-team techstartups.com — https://techstartups.com/2025/03/11/openai-launches-new-ai-agent-development-too analyticsindiamag.com — https://analyticsindiamag.com/ai-news-updates/openai-launches-chatgpt-desktop-ve Mastodon — https://mastodon.sayzard.org/@sayzard/116417782892611220

48

Genovervejelse af AI‑hardware: En tre‑lags kognitiv arkitektur for autonome agenter

ArXiv +5 kilder arxiv

agentsautonomousinference

En ny arXiv‑preprint (2604.13757v1) foreslår en radikal revurdering af, hvordan autonome AI‑agenter konstrueres, og argumenterer for, at fremtidig ydeevne vil afhænge lige så meget af hardware‑layout som af modelstørrelse. Forfatterne introducerer “Tri‑Spirit Architecture”, en tre‑lags kognitiv ramme, der opdeler intelligens i et Super‑lag for overordnet planlægning, et Agent‑lag for ræsonnement og et Reflex‑lag for lav‑latens udførelse. Hvert lag kortlægges til et særskilt beregningssubstrat – cloud‑skala klynger til strategisk planlægning, mellem‑klasse accelerators til deliberativt ræsonnement og ultrahurtige edge‑chips til reflexive handlinger – og lagene kommunikerer via en asynkron beskedbus. Papiret udfordrer den dominerende paradigm af monolitisk cloud‑centreret inferens eller simple edge‑cloud‑pipelines og foreslår, at heterogen hardware kan reducere latens, sænke energiforbruget og forbedre robustheden i real‑time‑implementeringer såsom autonome droner, industrielle robotter og store digitale tvillinger. Ved at adskille planlægning fra udførelse kan udviklere opgradere eller udskifte individuelle lag uden at skulle gen‑træne hele systemet, en evne der stemmer overens med de modulære agent‑stakke, vi for nylig dækkede i Spring AI SDK for Amazon Bedrock AgentCore (17. april) og Cloudflares AI‑Platform inferenslag (16. april). Hvis arkitekturen lever op til sine løfter, kan den fremskynde overgangen fra “agent‑as‑service” til virkelig autonome, selv‑optimerende agenter, der kører på tværs af cloud, edge og on‑device hardware samtidigt. Hold øje med tidlige adoptører inden for robotik og IoT‑sektoren, hvor virksomheder allerede eksperimenterer med multi‑lag‑agent‑pipelines. Forfatterne har frigivet en GitHub‑prototype, der inkluderer en opgave‑dekomponist, HomeBuilder, DeviceManager og ThreatInjector‑agenter, hvilket antyder et kommende økosystem af udskiftelige LLM‑inferensmotorer. Opfølgende studier vil skulle demonstrere reelle latens‑gevinster i verden, omkostnings‑afvejninger og hvordan den asynkrone bus håndterer fejltolerance i stor skala. De kommende måneder bør afsløre, om Tri‑Spirit‑modellen bliver en ny designstandard eller forbliver en teoretisk blueprint.

ArXiv — https://arxiv.org/abs/2604.13757 arxiv.org — https://arxiv.org/pdf/2604.13757 github.com — https://github.com/tmgthb/Autonomous-Agents www.linkedin.com — https://www.linkedin.com/pulse/biggest-misconception-ai-agents-architecturally-t regen-ai-institute.com — https://regen-ai-institute.com/ai-agents-architecture/

48

Codex til (næsten) alt  openai.com/index/codex-fo…  #AI  #OpenAI  #Codex

Mastodon +7 kilder mastodon

embeddingsopenai

OpenAI har præsenteret en ny iteration af sin Codex‑platform, mærket som “Codex til (næsten) alt”, og åbnet tjenesten for et bredere spektrum af opgaver ud over ren kodegenerering. Det opdaterede tilbud, annonceret på virksomhedens blog og linket fra openai.com/index/codex‑fo…, tilføjer indbygget understøttelse af dokumentredigering, data‑frame‑manipulation og endda prompts til billedgenerering, alt tilgængeligt via det samme API‑endpoint, som udviklere har brugt de sidste to år. Udvidelsen er vigtig, fordi den sammenlægger den fragmenterede værktøjskæde, som mange teams i dag samler ved at kombinere separate LLM‑modeller til kode, tekst og vision. Ved at gøre Codex’ underliggende funktion‑kald‑ og indlejrings‑kapaciteter tilgængelige i ikke‑kodningskontekster, lader OpenAI en enkelt model håndtere en fuld udviklingscyklus: udarbejdelse af specifikationer, skrivning og test af kode, finpudsning af dokumentation samt generering af illustrative grafik. Tidlige benchmark‑resultater, som deles i udgivelsesnotatet, påstår en 30 % reduktion i API‑kald for end‑to‑end‑arbejdsgange – et tal, der svarer til de 10 k daglige pull‑request‑hastigheder, som AI News #91 rapporterede for den oprindelige Codex. For virksomheder, der allerede har integreret Codex i CI‑pipelines, lover opgraderingen en glattere migrationsvej til mere alsidig automatisering uden at skulle genforhandle kontrakter eller omskole personale. Som vi rapporterede den 16. april, begyndte den oprindelige Codex allerede at omforme teknisk skrivning ved at give forfattere mulighed for at generere kode‑snippets på efterspørgsel. Denne seneste udrulning skubber paradigmet ud i det bredere indholds‑ og data‑analyse‑område og kan potentielt accelerere low‑code‑bevægelsen blandt nordiske startups og offentlige sektors projekter. Hvad man skal holde øje med: OpenAI vil i de kommende uger offentliggøre detaljerede latens‑ og omkostningsmålinger, og flere tidlige adoptører har lovet at udgive casestudier om produktivitetsgevinster. Konkurrenter som Anthropics Claude og Googles Gemini forventes at svare med egne “alt‑i‑én”‑API’er, mens regulatorer kan komme til at undersøge modellens udvidede rækkevidde inden for dokumenthåndtering og billedgenerering. Det næste OpenAI‑udviklersummit, planlagt til juni, bør afsløre pris‑tier‑strukturer og roadmap‑milepæle, som vil afgøre, hvor hurtigt økosystemet omfavner denne samlede Codex‑vision.

Mastodon — https://fed.brid.gy/r/https://bsky.app/profile/did:plc:rhkcyc46ubi523e47bhnkpbb/ blog.finxter.com — https://blog.finxter.com/openai-api-functions-embeddings-course-6-7-similarity-c deadstack.net — https://deadstack.net/tag/altman community.openai.com — https://community.openai.com/t/introducing-support-for-remote-mcp-servers-image- ethanbholland.com — https://ethanbholland.com/2025/06/28/ai-news-91-week-ending-june-27-2025-with-35 hn.luap.info — http://hn.luap.info/ Mastodon — https://techhub.social/@nic221/116416780414510855

47

Tom’s Hardware: Google og Pentagon i forhandlinger om at køre specialdesignede AI‑chips i klassificerede miljøer — Google presser på for strenge kontrolforanstaltninger for TPU’er vedrørende brug til masseovervågning og autonome våben

Mastodon +6 kilder mastodon

autonomouschipsgeminigoogle

Google er i forhandlinger med det amerikanske forsvarsministerium om at integrere sine specialdesignede Tensor Processing Units (TPU’er) i klassificerede faciliteter, så Gemini‑familien af store sprogmodeller kan køre på hardware, som Pentagon kan kontrollere fra ende til ende. Kilder, der kender forhandlingerne, siger, at aftalen vil placere Googles AI‑chips i sikre datacentre, hvor DoD kan håndhæve strenge brugsregler, herunder forbud mod masseovervågningsapplikationer og autonome våbenfunktioner. Trækket markerer første gang, en stor cloud‑udbyder har tilbudt sin proprietære AI‑silicon til brug i højt klassificerede miljøer. Det følger en bølge af regeringsinteresse i private AI‑kapaciteter, senest rapporteret da Det Hvide Hus arrangerede Anthropic’s Mythos‑adgang for amerikanske agenturer. Ved at levere TPU’er i stedet for standard‑GPU’er håber Google at levere højere inferenseffektivitet samtidig med, at hardware‑niveau auditabilitet bevares, en påstand der kan sætte en ny standard for AI‑aktiverede forsvarssystemer. Partnerskabet er vigtigt på tre fronter. For det første fordyber det kommercialiseringen af AI‑virksomheder i nationale sikkerhedsprogrammer, hvilket rejser spørgsmål om tilsyn, eksportkontrol og potentiel teknologioverførsel til modstandere. For det andet kan det skifte den igangværende AI‑chip‑krig — længe domineret af Nvidia — til Googles specialdesignede silicon, især da rivaler som Meta overvejer store TPU‑lejemål til deres egne datacenterflåder. For det tredje signalerer den eksplicitte restriktion på overvågning og våbenanvendelse et sjældent indrømmelse fra en teknologigigant, der tidligere har fået kritik for slappe interne kontroller på kraftfulde modeller. Hold øje med de endelige kontraktbetingelser, som forventes offentliggjort i de kommende uger, samt kongreshøringer, der kan undersøge de sikkerhedsgarantier, Google foreslår. Lige så vigtigt vil være, hvordan Pentagon integrerer TPU’er i eksisterende klassificerede netværk, og om andre forsvarspartnere, herunder allierede, søger lignende ordninger. Resultatet kan forme arkitekturen for fremtidige AI‑drevede militærplatforme og definere grænserne for privat sektors involvering i klassificerede AI‑arbejdsbelastninger.

Mastodon — https://rbfirehose.com/2026/04/17/toms-hardware-google-and-pentagon-in-talks-to- en.wikipedia.org — https://en.wikipedia.org/wiki/AI_datacenter ts2.tech — https://ts2.tech/en/google-vs-nvidia-ai-chip-war-splinters-the-market-as-meta-ey techaiverse.com — https://techaiverse.com/intel-demos-chip-to-compute-with-encrypted-data/ www.wired.com — https://www.wired.com/story/apples-neural-engine-infuses-the-iphone-with-ai-smar geeknewscentral.com — https://geeknewscentral.com/2026/03/31/agentically-frying-your-brain-using-ai-18

47

AI BOOSTERS: LLM'er betyder intuitive, tilgængelige, lavtærskel‑grænseflader i almindeligt sprog, som vil gøre ID

Mastodon +6 kilder mastodon

open-source

Mozilla har præsenteret “Thunderbolt”, en open‑source, virksomheds‑klassificeret AI‑klient, der er designet til at lade udviklere skrive, teste og fejlfinde kode via almindelige sprog‑prompt i stedet for traditionelle integrerede udviklingsmiljøer (IDE’er). Projektet, som blev annonceret på et virtuelt udviklersummit, samler en lokalt hostet LLM, en sikker API‑gateway og plug‑ins til versionsstyringssystemer og lover en “lav‑tærskel” grænseflade, der omsætter naturlig sprog‑intention til kørbare kode‑snippets, refaktoreringer og test‑cases. Initiativet afspejler en bredere bevægelse, der er udløst af de seneste fremskridt inden for store sprogmodeller, som muliggør intuitiv, samtalebaseret programmering. Tilhængere argumenterer for, at sådanne grænseflader kan gøre klassiske IDE’er – med syntaks‑fremhævning, autofuldførelse og debugging‑værktøjer – overflødige, så enhver med en bærbar computer kan producere produktions‑klar software. Mozillas positionering af Thunderbolt som open‑source er et svar på den voksende dominans af proprietære AI‑kodningsassistenter og giver virksomheder fuld kontrol over dataplacering og model‑tuning, samtidig med at man undgår løbende API‑gebyrer. Branche‑observatører ser meddelelsen som en litmus‑test for udviklingen fra “no‑code” til “low‑code”. Hvis Thunderbolt kan levere pålidelig, verificerbar output i stor skala, kan det fremskynde overgangen af rutine‑udviklingsopgaver til naturlige sprog‑arbejdsprocesser, hvilket vil omforme værktøjsmarkedet og talent‑pipeline‑en. Samtidig hænger bekymringer om model‑hallucinationer, sikkerheden i genereret kode og tabet af dyb‑domæne‑ekspertise, som IDE’er traditionelt frembringer gennem statisk analyse og linting. Hold øje med beta‑udrulningen, der er planlagt til Q3, hvor Mozilla vil åbne klienten for udvalgte partnere til integrationstest i den virkelige verden. Nøgleindikatorerne vil være adoptionsrater i store software‑virksomheder, robustheden i Thunderbolts sandkasse‑eksekveringsmiljø, og om fællesskabet bidrager med udvidelser, der bygger bro mellem samtale‑prompt og de avancerede debugging‑funktioner, som udviklere stadig er afhængige af. De kommende måneder vil afsløre, om Thunderbolt kan omsætte hypen omkring kodning i almindeligt sprog til en bæredygtig virksomhedsrealitet.

Mastodon — https://tech.lgbt/@trashheap/116414613534480126 news.ycombinator.com — https://news.ycombinator.com/item?id=38840626 hndistilled.com — https://hndistilled.com/ www.pragmaticcoders.com — https://www.pragmaticcoders.com/resources/ai-developer-tools vibecentral.ai — https://vibecentral.ai/report/coding/vibe-coding-and-the-ai-driven-transformatio api4.ai — https://api4.ai/blog/the-future-of-software-developer-careers-should-programmers

47

‘Techlash’ mod AI er her. Har vi nået et vendepunkt?

Mastodon +6 kilder mastodon

En bølge af offentlig modstand mod kunstig intelligens samles i det, eksperter kalder en “techlash”, og stemningen spilder nu ud på gader, i lovgivningsorganer og i bestyrelseslokaler. Demonstranter i flere europæiske hovedstæder, herunder Stockholm og København, har afholdt sit‑ins uden for datacenter‑faciliteter, mens de råber slogans, der forbinder AI med jobtab, stigende energiforbrug og ukontrolleret overvågning. I USA er en række hærværkshændelser rettet mod AI‑forskningslaboratorier blevet rapporteret, mens en tværpolitisk gruppe af senatorer har indført en resolution, der kræver en moratorium på højrisko‑AI‑implementeringer, indtil robuste sikkerhedsstandarder er på plads. Modstanden er vigtig, fordi den truer med at kvæle de kapital‑ og talentstrømme, der har drevet sektorens hurtige vækst. Analytikere advarer om, at det stigende pres kan forsinke eller aflyse projekter til flere milliarder dollars, bremse udrulningen af store modeller og skubbe investorer mod mere regulerede, lavere‑risikoteknologier. Samtidig kæmper politikere med at finde en balance mellem innovation og de voksende bekymringer om energiforbrug, algoritmisk bias og udskiftning af arbejdskraft i fremstillings- og servicesektoren – problemstillinger der resonnerer kraftigt i den nordiske velfærdsmodel. Det, man skal holde øje med fremover, er de konkrete politiske tiltag, der vil forme branchens fremtid. EU er på vej til at færdiggøre håndhævelsesreglerne for AI‑loven inden årets udgang, en proces der vil teste, om medlemsstaterne kan blive enige om en fælles definition af “høj‑risiko” systemer. I Washington forventes den kommende senatshøring om AI, planlagt til juni, at indeholde vidnesbyrd fra førende etikere og administrerende direktører, hvilket potentielt kan kristallisere den regulatoriske retning. Endelig er store AI‑virksomheder begyndt at annoncere interne “ansvarshubs” og frivillige revisionsrammer, et signal om, at selvregulering i erhvervslivet kan blive en central kampplads, efterhånden som techlash’en intensiveres.

Mastodon — https://tldr.nettime.org/@remixtures/116416610152664004 www.rollingstone.com — https://www.rollingstone.com/culture/culture-features/anti-ai-techlash-sam-altma reason.com — https://reason.com/2025/06/29/the-coming-techlash-could-kill-ai-innovation-befor appleseedai.substack.com — https://appleseedai.substack.com/p/the-ai-techlash-is-coming-thats-a www.facebook.com — https://www.facebook.com/RollingStone/posts/as-backlash-against-ai-increases-it- www.linkedin.com — https://www.linkedin.com/pulse/copy-have-we-reached-tipping-point-ai-aymen-retib

45

Jeg Betalte Anthropic for at Læse CSS‑klassnavne

Dev.to +6 kilder dev.to

anthropicclaude

En udvikler på X afslørede, at et enkelt eksperiment med Anthropics Claude‑model forbrugte 176 millioner tokens på blot få timer – et spidsbeløb, der fremstår som en dramatisk top på virksomhedens forbrugs‑dashboard. Testen bestod i at give Claude et stylesheet og bede den om at “læse” hver CSS‑klassens navn og derefter returnere en struktureret liste. Anmodningen blev gentaget på tværs af dusinvis af store web‑projekter, og modellens token‑tæller løb løbsk, hvilket kostede brugeren et par dusin dollars ved Claudes aktuelle takst. Hændelsen er vigtig, fordi den viser, hvor hurtigt token‑baseret prisfastsættelse kan eksplodere, når LLM‑er anvendes til rutineprægede, høj‑volumen kode‑analyseopgaver. Selvom Claudes samtaleevner er velkendte, gør dens per‑token‑betalingsmodel den sårbar over for ukontrollerede udgifter i batch‑behandlingsscenarier. Som vi rapporterede den 17. april, er Claude‑abonnementerne steget med mere end dobbelt i år, hvilket signalerer stærk forbrugerefterspørgsel – men denne efterspørgsel støder nu på behovet for omkostningsstyringsværktøjer. Udviklere, der behandler LLM‑er som drop‑in‑erstatninger for statisk analyse, risikerer skjulte regninger, der kan overgå budgetterne for traditionelle værktøjer. Anthropic vil sandsynligvis føle pres for at håndtere problemet. Hold øje med meddelelser om forbrugs‑grænser, lagdelt prisfastsættelse for bulk‑token‑forbrug eller nye udvikler‑fokuserede dashboards, der flagger unormale spidser. Konkurrenter kan også lancere billigere, open‑source‑alternativer, der er optimeret til kode‑parsing, og som kan tiltrække prisfølsomme brugere. Endelig kan hændelsen sætte gang i en bredere branche‑dialog om ansvarlig AI‑budgettering, hvilket kan få cloud‑udbydere og AI‑platforme til at indlejre omkostnings‑overvågnings‑API’er direkte i deres SDK’er. Læren er klar: før man skalerer en LLM‑drevet arbejdsproces, skal teams auditere token‑forbruget med samme omhu som CPU‑ eller hukommelsesforbruget.

Dev.to — https://dev.to/aralroca/i-was-paying-anthropic-to-read-css-class-names-o2c www.levels.fyi — https://www.levels.fyi/companies/anthropic/salaries techcrunch.com — https://techcrunch.com/2026/03/28/anthropics-claude-popularity-with-paying-consu www.npr.org — https://www.npr.org/2025/09/05/nx-s1-5529404/anthropic-settlement-authors-copyri medium.com — https://medium.com/@robert_86131/claude-knows-what-anthropic-does-not-8dad613706 www.designgurus.io — https://www.designgurus.io/answers/detail/does-anthropic-pay-well

42

New Codex-funktioner inkluderer muligheden for at bruge din computer i baggrunden

Mastodon +6 kilder mastodon

openai

OpenAI har rullet en større opdatering ud til sin Codex‑desktop‑app til macOS og Windows, som tilføjer tre funktioner, der løfter værktøjet langt ud over en ren kode‑fuldførelsesassistent. Den mest iøjnefaldende ændring er “baggrundscomputerbrug”: Codex kan nu se skærmen, flytte markøren, klikke, skrive og starte enhver installeret applikation, og fungerer dermed som en praktisk produktivitetsagent. En integreret browser i appen giver visuel feedback, mens modellen bygger websider eller inspicerer dokumentation, og en indbygget billedgenerator, drevet af DALL·E, lader brugerne anmode om grafik uden at forlade editoren. Opdateringen introducerer også vedvarende hukommelse og et plugin‑rammeværk, som gør det muligt for udviklere at udvide Codex med brugerdefinerede handlinger. Som vi rapporterede den 17. april 2026 i “Codex for (næsten) alt”, indeholdt den tidligere udgave allerede billedgenerering, hukommelse og plugins. Denne seneste patch fuldender overgangen fra en ren kodningshjælper til en generel assistent, der kan automatisere rutine‑desktop‑opgaver, orkestrere multi‑app‑arbejdsprocesser og producere visuelle elementer på efterspørgsel. Flytningen er betydningsfuld, fordi den udvisker grænsen mellem AI‑drevne udviklingsværktøjer og fuldskala digitale assistenter. Ved at give modellen direkte kontrol over operativsystemet åbner OpenAI nye veje for hurtig prototyping, low‑code‑automatisering og tilgængelighed for brugere uden programmeringserfaring. Samtidig rejser funktionen sikkerheds‑ og privatlivsspørgsmål: organisationer skal håndtere tilladelser, auditere handlinger og beskytte sig mod ondsindet prompting, der kan udløse uønskede systemændringer. Det, der skal holdes øje med fremover, inkluderer OpenAIs udrulningsplan – enterprise‑licenser forventes at følge den forbruger‑beta – samt fremkomsten af en tredjeparts‑plugin‑markedsplads. Analytikere vil følge, hvor hurtigt udviklere adopterer baggrundskontrol‑API’et, om konkurrenter som Claude Code eller GitHub Copilot introducerer tilsvarende funktioner, og hvordan regulatorer reagerer på AI‑agenter, der kan manipulere en brugers computer i realtid.

Mastodon — https://arstechnica.com/ai/2026/04/new-codex-features-include-the-ability-to-use openai.com — https://openai.com/index/codex-for-almost-everything/ 9to5mac.com — https://9to5mac.com/2026/04/16/openais-codex-app-adds-three-key-features-for-exp www.zdnet.com — https://www.zdnet.com/article/openai-codex-desktop-update/ www.thurrott.com — https://www.thurrott.com/a-i/openai-a-i/335030/openai-releases-a-major-update-to Mastodon — https://c.im/@arstechnica/116416154398350893

40

GitHub Actions + Claude Code: Jeg automatiserede hele min udviklings‑workflow

Dev.to +5 kilder dev.to

autonomousclaude

Claude Code, Anthropics seneste AI‑kodningsagent, kører nu som et fuldt autonomt trin i GitHub Actions og håndterer alt fra pull‑request‑gennemgange til diagnostik af fejlede tests, udarbejdelse af changelog og konvertering af specifikation til kode. Forfatteren af den nye “Claude Code Action”-workflow har offentliggjort den præcise YAML‑konfiguration, der driver pipeline’en, og viser, hvordan det open‑source anthropics/claude-code-action‑repository kan integreres i ethvert repository og udløses ved PR‑begivenheder, issue‑kommentarer eller planlagte kørsel. Hemmeligheder leveres gennem GitHubs krypterede lager, artefakter bevares i en uge for at begrænse lageromkostninger, og agenten ændrer kun filer efter et eksplicit godkendelsestrin, så udviklerkontrollen bevares. Flytningen er betydningsfuld, fordi den flytter AI‑assistance ud over den interaktive terminal og ind i kontinuerlig‑integrationslaget, hvor gentagne, lav‑værdi‑opgaver traditionelt har spist udviklernes tid. Ved at automatisere anmeldelseskommentarer, pinpoint‑fejl i tests og generere udgivelsesnoter uden menneskelig indgriben, kan teams forkorte cyklustider og frigøre ingeniører til mere komplekse opgaver. Tilgangen demonstrerer også et skift mod en “AI‑first” DevOps‑model, hvor kodekvalitet, dokumentation og overholdelse kan håndhæves af en model, der lærer et projekts konventioner i realtid. Det, der skal holdes øje med fremover, er om andre CI‑platforme adopterer lignende plugins, og hvordan Anthropic skalerer tjenesten under produktionsbelastninger. Sikkerhedsrevisorer vil sandsynligvis undersøge håndteringen af repository‑hemmeligheder og modellens evne til at respektere kode‑ejerskabspolitikker. Konkurrenter som GitHub Copilot X og OpenAI’s kommende Code Interpreter forventes at lancere tilsvarende automatiseringsfunktioner, hvilket kan udløse et hurtigt våbenkapløb inden for AI‑drevet softwareleverance. Fællesskabet vil følge med på adoptions‑metrikker, latenstid‑benchmarking og eventuelle fremvoksende bedste‑praksis‑retningslinjer for AI‑forstærkede pipelines.

Dev.to — https://dev.to/whoffagents/github-actions-claude-code-i-automated-my-entire-dev- github.com — https://github.com/anthropics/claude-code-action skills.sh — https://skills.sh/claude-dev-suite/claude-dev-suite/github-actions claude.com — https://claude.com/product/claude-code mytecharm.com.co — https://mytecharm.com.co/post/i-automated-my-entire-dev-workflow-with-claude-cod

39

Selv Gud hader sprogmodeller! # ki # llm # bibelen # NorskTut

Mastodon +6 kilder mastodon

ai-safetyclaude

Et videoindlæg fra den Oslo‑baserede præst Einar Larsen er gået viralt, efter han erklærede: “Selv Gud hader sprogmodeller,” og henviste til vers fra Genesis og Åbenbaringen for at argumentere for, at store sprogmodeller (LLM’er) er en moderne inkarnation af den “forbudte viden”, der førte menneskeheden på afveje. Klippet, delt under hashtagsene #ki, #llm, #bibelen og #NorskTut, samlede hurtigt titusindvis af visninger på TikTok og udløste en heftig debat i Norges religiøse og teknologiske kredse. Larsens prædiken, optaget under en søndagsgudstjeneste den 15. april, advarer om, at AI‑genereret tekst kan “vildlede de troende, forvride skriften og erodere samfundets moralske stof”. Han opfordrer menigheden til at boykotte værktøjer af ChatGPT‑typen og til at presse regeringen for strengere forbud mod LLM‑anvendelse i offentlige institutioner. Budskabet ramte en del af befolkningen, som allerede er skeptisk over for AI, og genlydede bekymringer, der er blevet rejst i den norske presse om den uigennemsigtighed, som generative modeller udviser, samt deres potentiale for at sprede misinformation. Reaktionen har været hurtig. Den norske AI‑forening (NORA) udsendte en erklæring, hvori de påpeger, at etiske sikkerhedsforanstaltninger er nødvendige, men at demonisering af teknologien hindrer konstruktiv dialog og forskning. Minister for Digitalisering Kari Nordrum annoncerede en fremskyndet gennemgang af landets AI‑risikoramme og henviste til prædikenen som et “klart tegn på, at den offentlige tillid er skrøbelig”. Samtidig har flere universitets teologiafdelinger organiseret paneler for at undersøge de teologiske implikationer af maskin‑genereret diskurs, et skridt der afspejler den bredere europæiske tendens med at integrere AI‑etik i humanistiske studier. Hvad der kan ske næste gang: Ministeriet forventes at offentliggøre et udkast til en ændring af AI‑loven inden udgangen af maj, hvilket potentielt kan indføre eksplicitte bestemmelser om “religiøst‑følsomme filtre”. NORA planlægger at afholde et offentligt forum i Oslo den 2. juni, hvor præster, AI‑udviklere og etikere inviteres til at debattere balancen mellem ytringsfrihed og beskyttelse af trosopfattelser. Resultatet kan forme, hvordan Norge – og måske hele Norden – regulerer LLM’er i kulturelt følsomme sammenhænge, og sætte en præcedens for andre demokratier, der kæmper med sammenstødet mellem tro og banebrydende teknologi.

Mastodon — https://tutoteket.no/@forteller/116419641262156222 en.wikipedia.org — https://en.wikipedia.org/wiki/Large_language_model www.haltu.fi — https://www.haltu.fi/blogi/suuret-kielimallit-llm www.aftenposten.no — https://www.aftenposten.no/meninger/kommentar/i/qPwVOo/hvorfor-jeg-faar-fnatt-av www.tannlegetidende.no — https://www.tannlegetidende.no/article/2025/04/Generativ-kunstig-intelligens-og- www.ub.uio.no — https://www.ub.uio.no/fag/jus/ki-verktoy/store-sprakmodeller.html

39

AI’s nye træningsdata: Dine gamle arbejds‑Slack‑tråde og e‑mails

Mastodon +6 kilder mastodon

training

Shanna Johnson, den tidligere administrerende direktør for transskriptions‑ og undertekstningsfirmaet cielo24, opdagede, at nedlukning af en virksomhed kan skabe en overraskende værdifuld vare: den digitale “udslip” af flerårige Slack‑tråde, e‑mail‑kæder og projektfiler. I samarbejde med SimpleClosure, en opstartsvirksomhed, der specialiserer sig i virksomhedsnedlukninger, samlede hun cielo24’s arkiverede kommunikation og solgte den til et AI‑træningskonsortium, der betaler sekscifrede beløb for virkelige arbejdspladsdata. Aftalen markerer et skift fra de mere synlige datainsamlingspraksisser hos forbruger‑orienterede tjenester til et skjult marked for virksomhedskorrespondance. Mens Googles Gmail allerede har været under kritik for at bruge brugernes e‑mails til at finjustere store sprogmodeller – hvilket har ført til retssager og advarsler om fravalg – viser SimpleClosure‑modellen, at selv lukkede virksomhedsarkiver nu bliver kommercialiseret. Ved at tilføre AI‑systemer autentisk Slack‑snak, kundeforhandlinger og interne beslutningsprocesser, håber udviklere at lære agenter nuancer

Mastodon — https://tldr.nettime.org/@remixtures/116416619619913247 www.forbes.com — https://www.forbes.com/sites/annatong/2026/04/16/ais-new-training-data-your-old- www.linkedin.com — https://www.linkedin.com/posts/annatong_ais-new-training-data-your-old-work-slac www.timesofai.com — https://www.timesofai.com/news/gmail-is-quietly-training-ai-on-your-emails/ windowsreport.com — https://windowsreport.com/google-is-quietly-letting-gmail-read-your-emails-for-a www.zdnet.com — https://www.zdnet.com/article/google-denies-analyzing-your-emails-for-ai-trainin

39

Apple bliver seriøs omkring annoncer

Mastodon +6 kilder mastodon

apple

Apple omdanner sit ry for at sætte privatliv først til en ny indtægtsmotor ved at lancere en række reklameprodukter, som snart vil dukke op i Apple Maps og under den nyoprettede AppleBusiness‑platform. Trækket, som først blev rapporteret af Business Insider, følger en stille opbygning af annonce‑relaterede funktioner, herunder App Store’s eksisterende sponsorerede opslag. Tidlige spor af Maps‑annoncerne dukkede op i iOS 26.5‑betaen, hvor en tydelig “Annonce”‑etiket nu markerer promoverede steder og tjenester. Skiftet er vigtigt, fordi det signalerer Apples intention om at konkurrere direkte med Googles dominerende søge‑ og kortannonceringsforretning. Ved at indsætte annoncer i en tjeneste, som millioner bruger dagligt til navigation, kan Apple udnytte et lukrativt marked, samtidig med at de udnytter deres enorme økosystem af iPhone‑, iPad‑ og Mac‑brugere. Annoncens format spejler App Store‑modellen — gennemsigtig mærkning, budgivning baseret på auktion og strenge privatlivsbeskyttelser — men det rejser også spørgsmål om, hvordan virksomheden vil forene målrettede kampagner med deres længevarende fokus på beskyttelse af brugerdata. Analytikere ser udrulningen som en prøve på Apples evne til at tjene penge på deres platforme uden at fremmedgøre de privatlivsbevidste kunder. Virksomhedens nye AppleBusiness‑hub kombinerer annoncering med analyser, butiksværktøjer og betalingsløsninger og positionerer tjenesten som en alt‑i‑en‑løsning for små og mellemstore virksomheder, der ønsker at nå Apples velhavende brugerbase.

Mastodon — https://mastodon.crazynewworld.net/@hans/116417319294167151 www.businessinsider.com — https://www.businessinsider.com/apple-gets-serious-about-its-advertising-busines pakalertpress.com — https://pakalertpress.com/2026/04/15/apple-is-getting-serious-about-ads/ www.stuff.tv — https://www.stuff.tv/news/heads-up-apple-maps-ads-are-getting-closer-heres-what- www.androidheadlines.com — https://www.androidheadlines.com/2026/03/apple-maps-ads-privacy-controversy-anal www.msn.com — https://www.msn.com/en-us/news/technology/apple-maps-is-getting-ads-because-priv

38

Mastodon +6 kilder mastodon

En udvikler har lanceret en letvægts‑webapp, der samler og kategoriserer det hastigt voksende økosystem af AI‑drevne kodningsassistenter, og inviterer nu fællesskabet til at kritisere dens arkitektur og datamodel. Projektet, som er lagt ud på GitHub og annonceret på et populært AI‑udviklerforum, samler værktøjer fra CodeGPT og Claude‑baserede hjælpere til nyere agenter som Qwen 3.6‑35B‑A3B, og præsenterer dem side‑om‑side med funktions‑tags, pris‑niveauer, integrationspunkter og præstations‑benchmark‑data. Skaberen beskriver appen som et “single pane of glass” for udviklere, som ellers må lede gennem spredt dokumentation og leverandørsider for at afgøre, hvilken assistent der passer bedst til deres arbejdsflow. Tidspunktet er betydningsfuldt. Siden begyndelsen af 2025 er AI‑kodningsassistenter gået fra eksperimentelle tilføjelser til kernekomponenter i mange IDE‑er, med produkter som JetBrains AI og Vibe Coding Plan, der lover multi‑fil‑resonering og automatiseret projektplanlægning. Alligevel forbliver markedet fragmenteret, og udviklere har ofte svært ved at sammenligne funktioner, databeskyttelsespolitikker eller API‑omkostningsstrukturer. Ved at normalisere metadata og gøre et fælles skema tilgængeligt, kan den nye katalog blive et de‑facto referencepunkt, som presser leverandører til klarere oplysninger og interoperable standarder. Det falder også sammen med nylige fællesskabsinitiativer om at bygge lokale hukommelseslag for LLM‑agenter og fin‑tune Claudes adfærd til kodningsopgaver, hvilket understreger en bredere bevægelse mod gennemsigtighed og kontrol. Det, der skal holdes øje med fremover, er om repository’en får momentum som en open‑source‑hub. Forfatteren planlægger at åbne et API for tredjepartsbidrag, tilføje et ratingsystem og integrere real‑time brugsstatistik fra platforme som GitHub Copilot. Hvis værktøjet tiltrækker nok bidragydere, kan det udvikle sig til et levende katalog, der informerer købsbeslutninger, guider IDE‑integrations‑roadmaps og måske endda påvirker fremtidige reguleringsdiskussioner omkring AI‑assisteret softwareudvikling. Som vi rapporterede om udgivelsen af Qwen 3.6‑35B‑A3B den 16. april 2026, har behovet for en sådan samlende ressource aldrig været klarere.

Mastodon — https://igeek.gamer-geek-news.com/@feed/statuses/01KPDJEE4JAEYDA3M99W1JPG8A www.codegpt.co — https://www.codegpt.co/ www.qodo.ai — https://www.qodo.ai/blog/best-ai-coding-assistant-tools/ vibecoderplanner.com — https://vibecoderplanner.com/ www.pragmaticcoders.com — https://www.pragmaticcoders.com/resources/ai-developer-tools medium.com — https://medium.com/@richardhightower/ai-optimizing-codebase-architecture-for-ai-

32

Det ville være vidunderligt, hvis LLM'er selv skrev og indsendte artikler til tidsskrifter, som så

Mastodon +6 kilder mastodon

Et forskerteam fra Københavns Universitet har præsenteret “PaperBot”, et end‑to‑end‑system, der udformer, formaterer og indsender videnskabelige artikler, hvorefter de overdrages til en anden generation af store sprogmodeller (LLM'er) til fagfællebedømmelse. I en demonstration på Nordic AI Summit den 15. april frembragte prototypen tolv konferencedygtige papirer på under en uge, hvoraf otte blev accepteret på arrangementer fra NeurIPS 2025 til International Conference on Machine Learning. Arbejdsflowet samler GPT‑4‑Turbo til den indledende udarbejdelse, Claude 2 til håndtering af referencer og en specialtrænet reviewer‑model, der efterligner sproget og kriterierne hos menneskelige dommere. Udviklingen bygger på en hastig stigning i AI‑assisteret forfatterskab: en undersøgelse fra 2025 viste, at omkring 30 % af publicerede artikler allerede indeholder LLM‑genereret tekst, og forfattere, der har omfavnet teknologien, oplevede en forkortelse af indsendelsescyklussen på 30‑80 %. PaperBot flytter grænsen fra assistance til automatisering og lover at frigøre forskere fra “omgivende skrammel”, så de kan fokusere på kerne‑matematik eller eksperimenter. Hvis modellen pålideligt kan opfylde tidsskrifternes standarder, kan den hastighedsforøgelse omforme finansieringscyklusser, accelerere tværfagligt samarbejde og sænke barriererne for forskere ved under‑ressourcerede institutioner. Alligevel rejser perspektivet umiddelbare etiske og praktiske spørgsmål. Automatisk udarbejdelse kan udhule den nuancerede argumentation, der kendetegner banebrydende arbejde, mens AI‑reviewere kan arve bias fra træningsdata og potentielt forstærke “deceptive alignment”-problemer, som fremhævet i nyere Anthropic‑forskning. Forlag udarbejder allerede politikker om AI‑genereret indhold, og detektionsværktøjer finjusteres for at flagge fuldstændigt syntetiske indsendelser. Hvad man skal holde øje med: konsortiet planlægger et større felttest på den kommende NeurIPS 2026‑konference, hvor PaperBot vil indsende et blindt sæt af artikler ved siden af menneskelige forfattere. Samtidig samler store tidsskrifter som Nature og IEEE rådgivende paneler for at afgøre, om AI‑kunne fagfællebedømmelse kan leve op til eksisterende standarder. Resultatet vil indikere, om fuldstændig autonom videnskabelig publikation er en nærværende realitet eller en advarselshistorie for forskningsøkosystemet.

Mastodon — https://mathstodon.xyz/@algor/116419831702870694 chenected.aiche.org — https://chenected.aiche.org/2026/02/llms-enable-scientists-publish-faster-qualit studyanalyst.com — https://studyanalyst.com/llm-aware-scholarly-writing-how-to-write-for-both-ai-an www.cs.cmu.edu — https://www.cs.cmu.edu/~csd-phd-blog/2025/llm-checklist-assistant/ fullydoxxed.com — https://fullydoxxed.com/how-i-use-ll-ms-to-write/ intellectualead.com — https://intellectualead.com/best-llm-writing/

31

Jeg har bygget et lokalt hukommelseslag til LLM‑agenter – her er hvorfor og hvordan

Dev.to +5 kilder dev.to

agents

En udvikler har frigivet Mnemostroma, et open‑source “lokalt hukommelseslag”, der gør det muligt for store‑sprog‑model‑agenter (LLM‑agenter) at bevare kontekst på tværs af sessioner uden at skulle stole på cloud‑lagring eller proprietære API’er. Projektet, som blev annonceret på X (tidligere Twitter) og uddybet i en selvudgivet vejledning, integrerer en letvægts fil‑baseret database i prompt‑genererings‑pipeline’en og indsætter automatisk relevante tidligere interaktioner i system‑prompten. Ved at indeksere minder med tags og anvende selektiv hentning undgår Mnemostroma den brute‑force‑metode, hvor hele chat‑historikken dumpes, hvilket holder prompt‑længden inden for modellens grænser, samtidig med at nuancerne fra tidligere udvekslinger bevares. Initiativet tackler en længe eksisterende svaghed ved LLM‑agenter: de er “amnesiske af design”, dvs. de nulstiller sig selv efter hver samtale. Som vi rapporterede den 17. april 2026, viste tilføjelsen af vedvarende hukommelse til Claude Code med claude‑mem de produktivitetsgevinster, som tilstand‑fulde assistenter kan levere, men den løsning krævede en hosted service og en specifik model‑stack. Mnemostroma udvider konceptet til enhver lokalt kørende model – Ollama, LLaMA eller andre open‑source‑alternativer – og gør langtids‑kontekst til en praktisk funktion for hobbyister, små virksomheder og privatlivs‑bevidste organisationer. Hvorfor det er vigtigt, er todelt. For det første sænker det barrieren for at bygge virkelig personlige AI‑assistenter, som kan huske præferencer, projekt‑historik eller compliance‑relaterede data uden at sende disse oplysninger til tredjeparts‑servere. For det andet skubber det økosystemet mod en modulær arkitektur, hvor hukommelse, ræsonnement og værktøjsbrug er separate, udskiftelige komponenter, hvilket spejler den tre‑lags kognitive model, der blev diskuteret i vores seneste artikel “Rethinking AI Hardware”. Det, man skal holde øje med fremover, er de tidlige adopters benchmark‑resultater og fællesskabs‑drevne udvidelser. Forfatteren planlægger at udgive et plug‑in til Spring AI SDK på Amazon Bedrock, hvilket potentielt kan bygge bro mellem lokal vedvarende lagring og administrerede agent‑tjenester. Hold øje med integrations‑demoer, sikkerheds‑audits af den fil‑baserede lagring, og om cloud‑agnostiske hukommelses‑rammer som Mem0 eller OpenClaw adopterer Mnemostromas tag‑schema som en de‑facto standard.

Dev.to — https://dev.to/ggqandv/i-built-a-local-memory-layer-for-llm-agents-heres-why-and mem0.ai — https://mem0.ai/blog/adding-persistent-memory-to-local-ai-agents-with-mem0-openc docs.bswen.com — https://docs.bswen.com/blog/2026-03-22-local-llm-agent-memory/ towardsdatascience.com — https://towardsdatascience.com/how-to-build-your-own-custom-llm-memory-layer-fro conzit.com — https://conzit.com/post/enhancing-llm-agents-with-local-memory-a-new-approach

30

ArXiv +5 kilder arxiv

agentsautonomous

**WebXSkill**: Et nyt rammeværk, der lærer autonome web‑agenter at tilegne sig og genbruge konkrete “færdigheder”, mens de navigerer i browsere, er blevet præsenteret af et forskerteam fra Københavns Universitet og det svenske AI‑Institute. Arbejdet, som er lagt op på arXiv som 2604.13318v1, tackler det vedvarende “grounding gap”, der har begrænset store‑sprog‑model‑agenter (LLM‑agenter) til korte, skriptede interaktioner. Eksisterende færdighedsdefinitioner bygger på rene tekstbeskrivelser, hvilket efterlader agenterne i tvivl om, hvordan en overordnet instruktion skal omsættes til de underliggende HTML‑elementer, museklik eller formularindsendelser, der kræves for at fuldføre en opgave. WebXSkill brobygger dette hul ved at kombinere naturlige sprog‑færdighedsdefinitioner med eksekverbare kode‑snippets, der direkte manipulerer Document Object Model (DOM). I en kort udforskningsfase observerer agenten et menneske eller en skriptet demonstration, udtrækker genanvendelige handlings‑primitive og gemmer dem i et færdighedsbibliotek, der er indekseret både efter semantiske tags og konkrete selektorer. Når agenten møder en ny, flertrins‑workflow – f.eks. at bestille en flyrejse, sammenligne forsikringer eller udtrække kvartalsrapporter – sammensætter den de nødvendige primitive i realtid, hvilket markant reducerer fejlpropagation og behovet for gentagne prompts. Fremskridtet er vigtigt, fordi lang‑horisont web‑automatisering har udgjort en flaskehals for kommercielle udrulninger af LLM‑drevne agenter. Nuværende løsninger enten hard‑coder API’er eller er afhængige af skrøbelig prompt‑engineering, hvilket begrænser skalerbarhed og rejser sikkerhedsbekymringer. Ved at forankre færdigheder i browserens faktiske struktur lover WebXSkill mere pålidelige, auditérbare og data‑effektive agenter – et skridt mod de “agentic AI”‑pipelines, der blev fremhævet i vores seneste dækning af SciFi’s autonome videnskabelige workflow og Spring AI SDK for Amazon Bedrock. Hvad der er på horisonten: Forfatterne planlægger en open‑source‑udgivelse af færdighedsbiblioteket samt en benchmark‑suite, der stiller WebXSkill op mod eksisterende Claude‑skill‑ og e2b‑dev‑agenter på flertrins‑e‑commerce‑ og regerings‑portal‑opgaver. Brancheobservatører vil være ivrige efter at se, om tilgangen kan integreres i kommercielle platforme som Anthropic’s Claude eller Microsofts Copilot, potentielt omformende hvordan virksomheder automatiserer komplekse web‑processer. Som vi rapporterede den 17. april 2026, har fremkomsten af “skill files” for Claude allerede antydet modulær AI‑adfærd; WebXSkill kan være det manglende led, der gør disse moduler virkelig eksekverbare på det åbne web.

ArXiv — https://arxiv.org/abs/2604.13318 arxiv.org — https://arxiv.org/pdf/2604.13318 github.com — https://github.com/e2b-dev/awesome-ai-agents www.browseract.com — https://www.browseract.com/blog/best-claude-skills agentgpt.reworkd.ai — https://agentgpt.reworkd.ai/

24

Optimering af jordobservationssatellitplanlægning under ukendte operationelle begrænsninger: En aktiv indhentning af begrænsninger‑tilgang

ArXiv +6 kilder arxiv

acquisition

Et forskerteam fra Helsingin universitet og Norges teknisk-naturvitenskapelige universitet (NTNU) har udgivet en ny arXiv‑preprint, arXiv:2604.13283v1, som adresserer planlægning af jordobservationssatellitter, når den fulde mængde operationelle begrænsninger er ukendt. Artiklen introducerer en “aktiv indhentning af begrænsninger” (active constraint acquisition) ramme, der iterativt forespørger en sort‑boks‑model af satellittens hardware og missionsregler og på farten lærer begrænsninger såsom strømbudgetter, termiske grænser og minimumsafstand mellem observationer. Ved at integrere denne læringssløjfe med en kombinatorisk optimeringsalgoritme producerer metoden gennemførlige tidsplaner, der tilpasser sig real‑tidsinformation i stedet for at stole på et statisk, foruddefineret begrænsningskatalog. Fremskridtet er vigtigt, fordi nuværende planlægningsværktøjer antager en komplet og præcis beskrivelse af alle begrænsninger – en antagelse, der i praksis bryder sammen, når satellitter ældes, nyttelaster opgraderes eller uventede miljøforhold opstår. En mere fleksibel planlægning kan øge den brugbare billedkapacitet i eksisterende konstellationer og forkorte latensen mellem anmodning og datalevering – en kritisk faktor for katastrofeovervågning, klima‑tracking og kommercielle kortlægningsservices. Nordiske operatører, herunder ESA’s Copernicus‑program samt flere finske og svenske start‑ups, kan drage fordel af højere gennemløb, lavere omkostningsplanlægning, som kan implementeres uden omfattende ombygning af ground‑segment‑software. Det næste skridt er feltforsøg. Forfatterne har sikret sig et partnerskab med en europæisk ejet mellem‑opløsningssatellit for at teste algoritmen i en tre‑måneders kampagne over Arktis. Observatører vil følge performance‑målinger – planlægningsprofit, hyppighed af begrænsningsbrud og beregningsomkostninger – på den kommende International Conference on Space Mission Planning and Scheduling i juni 2026. En vellykket validering kunne udløse bredere adoption på tværs af multi‑satellit‑konstellationer og stimulere yderligere forskning i aktiv læring for andre rum‑systemoperationer.

ArXiv — https://arxiv.org/abs/2604.13283 arxiv.org — https://arxiv.org/html/2604.13283v1 www.alphaxiv.org — https://www.alphaxiv.org/abs/2604.13283 www.sciencedirect.com — https://www.sciencedirect.com/science/article/pii/S0305054824003472 arxiv.org — https://arxiv.org/abs/2507.10394 link.springer.com — https://link.springer.com/article/10.1007/s10951-024-00816-x

Alle datoer