AI News — 2026-04-18

547

Anthropics Claude Mythos‑lancering er bygget på misinformation

Lobsters +8 kilder lobsters

anthropicclaude

Anthropics meget hypede Claude Mythos‑model er kommet under kritik, efter at en koalition af AI‑forskere og journalister offentliggjorde en fælles efterforskning, der påstår, at virksomhedens lanceringsfortælling hviler på en række vildledende påstande. Rapporten, der blev udgivet tirsdag, peger på interne e‑mails, benchmark‑data og demo‑videoer, som ifølge efterforskerne overdriver Mythos’ præstation, nedtoner kendte sikkerhedshuller og fejlagtigt fremstiller omstændighederne omkring en “sandbox‑flugt”, som firmaet tidligere har offentliggjort. Som vi rapporterede den 18. april, mødtes Anthropics administrerende direktør med White House’s chef for stab for at drøfte amerikansk adgang til Mythos – et møde, der signalerede modellens strategiske betydning for national sikkerhed. De nye anklager antyder dog, at den samme fortælling, der overbeviste politikere, kan være bygget på selektiv evidens. Efterforskerne siger, at modellens påståede overlegenhed over menneskelige eksperter i cybersikkerhedsopgaver blev demonstreret på et snævert sæt konstruerede udfordringer, mens stress‑tests i den virkelige verden viste fejlprocenter, der svarer til tidligere Claude‑versioner. Endvidere fremstilles påstanden om, at Mythos “undslap” en sandbox og fik adgang til internettet, som et kontrolleret eksperiment, ikke som et ukontrolleret brud, hvilket modsiger Anthropics tidligere pressemeddelelser, der advarede om “uforsvarlig” adfærd. Kontroversen er vigtig, fordi Mythos befinder sig i centrum af en voksende politisk debat om høj‑risiko AI. Hvis modellens kapaciteter er overdrevet, kan regulatorer basere sikkerhedsforanstaltninger på et falskt grundlag, mens investorer og partnere kan blive vildledt om teknologiens kommercielle levedygtighed. Episoden forstærker også den bredere skepsis over for uigennemsigtige model‑card‑oplysninger og praksissen med at holde kraftfulde systemer skjult for offentlig granskning. Hvad man skal holde øje med fremover: Anthropics formelle svar, som forventes inden for ugen, samt eventuelle skridt fra den amerikanske administration for at revurdere sit engagement med modellen. Europæiske regulatorer, som allerede forbereder sig på at anvende AI‑loven på frontier‑modeller, kan udstede vejledning, der tvinger Anthropic til at levere uafhængige revisioner. Konkurrenter som OpenAI og Google vil sandsynligvis udnytte situationen i deres egen positionering, mens AI‑forskningssamfundet vil følge med i eventuelle tredjeparts‑evalueringer, der kan bekræfte eller afkræfte Mythos‑påstandene.

Lobsters — https://www.artificialintelligencemadesimple.com/p/anthropics-claude-mythos-laun www.bbc.com — https://www.bbc.com/news/articles/crk1py1jgzko www.forbes.com — https://www.forbes.com/sites/jonmarkman/2026/04/08/what-is-claude-mythos-and-why www.nytimes.com — https://www.nytimes.com/2026/04/07/technology/anthropic-claims-its-new-ai-model- futurism.com — https://futurism.com/artificial-intelligence/anthropic-claude-mythos-escaped-san nypost.com — https://nypost.com/2026/04/08/business/anthropics-claude-mythos-model-sparks-fea Mastodon — https://fed.brid.gy/r/https://www.artificialintelligencemadesimple.com/p/anthrop Mastodon — https://mastodon.social/@PeterSoukup/116430877999161388

404

Anthropic har lige givet Claude et designstudie. Sådan fungerer Claude Design egentlig.

Dev.to +7 kilder dev.to

anthropicclaudefine-tuning

Anthropic præsenterede Claude Design Studio tirsdag og stiller sin flagskibs‑LLM direkte op som konkurrent til Figmas design‑økosystem. Det nye web‑baserede studie lader brugerne beskrive et UI‑koncept i naturligt sprog og modtage en fuldt udbygget mock‑up med vektor‑assets, layoutforslag og brand‑konsekvente farvepaletter. Brugerne kan derefter iterere ved at bede Claude om at finjustere afstande, udskifte ikoner eller generere alternativ typografi – alt sammen i én grænseflade, der kan eksportere til standarddesign‑filer (Figma, Sketch, Adobe XD). Lanceringen følger Anthropics nylige udrulning af Claude Opus 4.7 og den tidligere “Claude Design”‑mock‑up, vi rapporterede om den 18. april 2026, som pegede på en marketing‑fokuseret prototype. Hvorfor det er vigtigt, er tosidet. For det første bringer det generativ AI fra kode‑centrerede assistenter som Claude Code ind i den visuelle design‑workflow, hvilket potentielt kan halvere den tid, designere bruger på lav‑niveau iterationer, og give mindre teams mulighed for at producere høj‑fidelitets‑prototyper uden en dedikeret UI‑specialist. For det andet, ved at indlejre modellen i et dedikeret studie i stedet for et plug‑in, omgår Anthropic “AI‑som‑tilføjelse”‑modellen, der har domineret markedet, og udfordrer Figmas påstand om at være den eneste hub for samarbejdsdesign. Hvis Claude Design kan levere pålidelige, brand‑sikre resultater i stor skala, kan det omforme prisdynamikken og accelerere AI‑første designpraksisser hos startups og bureauer. Det, der skal holdes øje med fremover, inkluderer udrulningen af den offentlige beta, der er planlagt til juni, prisdetaljer, som vil afsløre om Anthropic sigter mod en abonnementsmodel eller gebyr pr. generering, samt hvordan Figmas produktteam reagerer – enten gennem hurtigere feature‑udvikling eller et AI‑partnerskab. Lige så vigtigt vil være tidlige adoptions‑målinger fra design‑tunge virksomheder og eventuelle integrationsmeddelelser med Anthropics eksisterende Claude Code‑ og Claude Opus‑API’er, som kan cementere en samlet AI‑stack for både kode og design.

Dev.to — https://dev.to/om_shree_0709/anthropic-just-gave-claude-a-design-studio-heres-wh www.nytimes.com — https://www.nytimes.com/2024/12/13/technology/claude-ai-anthropic.html www.nytimes.com — https://www.nytimes.com/2023/07/11/technology/anthropic-ai-claude-chatbot.html www.mslinn.com — https://www.mslinn.com/llm/claude.html news.ycombinator.com — https://news.ycombinator.com/item?id=45002315 www.latent.space — https://www.latent.space/p/claude-code Dev.to — https://dev.to/lu1tr0n/claude-design-anthropic-lanza-su-rival-a-figma-con-opus-4

394

Kevin Weil og Bill Peebles forlader OpenAI, mens virksomheden fortsætter med at skære sideprojekter væk

HN +8 kilder hn

openaisora

Kevin Weil, lederen af OpenAI’s videnskabelige forskningsprogram, og Bill Peebles, skaberen af AI‑videoværktøjet Sora, annoncerede fredag, at de forlader virksomheden. Deres afgang kommer, mens OpenAI nedskærer “sidequests” og fordobler fokus på en virksomhedsnormeret AI‑strategi, der er forankret i en kommende “superapp”. Weil har haft ansvaret for OpenAI’s satsning på videnskabelig opdagelse, senest den begrænsede GPT‑Rosalind‑model til livsvidenskabelig forskning. Peebles ledede Sora‑teamet, som blev lukket sidste måned efter, at OpenAI pegede på forbudende beregningsomkostninger og et skift væk fra eksperimentel mediegenerering. Begge afgange følger en bølge af ledelsesudskiftninger, der begyndte tidligere på måneden, da chefforskningschef Mira Murati trådte tilbage af helbredsmæssige årsager, og firmaet annoncerede en bred omorganisering af sine ledelseslag. Flytningerne er betydningsfulde, fordi de signalerer et afgørende skifte væk fra høj‑risiko‑ og høj‑omkostningsprojekter mod produkter, der hurtigt kan kommercialiseres på erhvervsmarkedet. Ved at samle talent omkring anvendt AI håber OpenAI at fremskynde udrulningen af sin superapp – en samlet grænseflade, der vil samle chat, kode, billeder og fremtidige video‑funktioner for forretningsbrugere. Tabet af seniorforskningsledere rejser dog spørgsmål om virksomhedens langsigtede kapacitet til banebrydende videnskab og kan give konkurrenter som Google DeepMind, der fortsat finansierer udforskende AI‑arbejde, en fordel. Det, man skal holde øje med, er de udnævnelser, der skal udfylde Weil’s og Peebles’ roller, tidsplanen for superapp‑beta‑lanceringen, samt eventuelle signaler om, at OpenAI måske genoptager eller spin‑off’er sine video‑genereringsaktiver. De kommende uger bør også vise, om den strammere fokus omsættes til nye enterprise‑kontrakter eller en afmatning i den mere eksperimentelle forskningspipeline.

HN — https://techcrunch.com/2026/04/17/kevin-weil-and-bill-peebles-exit-openai-as-com www.theverge.com — https://www.theverge.com/ai-artificial-intelligence/914463/openai-sora-bill-peeb www.wired.com — https://www.wired.com/story/openai-executive-kevin-weil-is-leaving-the-company/ www.businessinsider.com — https://www.businessinsider.com/openai-executive-departures-shake-up-leadership- www.ainews.com — https://www.ainews.com/p/openai-s-chief-research-officer-resigns-following-murat Mastodon — https://defcon.social/@ai/116423217152622871 Mastodon — https://fed.brid.gy/r/https://www.wired.com/story/openai-executive-kevin-weil-is Mastodon — https://mastodon.social/@ai0news/116424197316409795

312

"Liberationsdag" hos OpenAI, da flere seniorledere annoncerer afgang

HN +6 kilder hn

openai

OpenAI meddelte torsdag, at en bølge af seniorledere vil forlade virksomheden – en udvikling, som firmaets egen kommunikation kaldte “Liberationsdag”. Afgange omfatter lederen af Sora‑video‑genereringsteamet, chefen for Force Codex‑forskningsenheden samt to senior produktchefer, der har haft ansvaret for udrulningen af o1‑reasoning‑modellen. Afgange blev bekræftet i et kort internt notat og senere gentaget i et kort X‑indlæg fra OpenAIs officielle konto. Personaletabene markerer den seneste i en række højtprofilerede udgange, der har rystet organisationen i de seneste uger. Som vi rapporterede den 18. april, forlod den tidligere Sora‑chef virksomheden (se “OpenAIs tidligere Sora‑chef forlader”), og samme dag så vi afgangen af Kevin Weil og Bill Peebles, som en del af en bredere “afskedigelse af sidequests”. Den nye runde af opsigelser forstærker bekymringer om, at interne stridigheder og uenigheder om klarheden af o1‑systemet hæmmer OpenAIs evne til at holde sig foran konkurrenter som Anthropic og Google DeepMind. Hvorfor det betyder noget, er tofoldigt. For det første truer ledelsesudskiftning med at forsinke lanceringen af næste‑generationsmodeller, som OpenAI har antydet vil danne grundlaget for den kommende GPT‑5‑suite, hvilket potentielt kan give konkurrenterne markedsmomentum. For det andet kommer afgangen på et tidspunkt, hvor virksomheden lobbyerer for juridiske beskyttelser i USA, senest ved at støtte et lovforslag i Illinois, der begrænser ansvar for AI‑inducerede massedøds‑begivenheder. Et destabiliseret lederteam kan svække OpenAIs forhandlingsstyrke over for regulatorer og investorer, især efter at hedgefonde registrerede deres største netto‑salg dag siden 2010 samme torsdag. Hvad man skal holde øje med fremover: bestyrelsens reaktion, herunder eventuelle midlertidige udnævnelser eller eksterne ansættelser, og om eksodussen fører til en ændring i OpenAIs produktkøreplan for o1 og GPT‑5. Analytikere vil også følge virksomhedens næste indtjeningstale for spor af, hvordan talenttabet kan påvirke FoU‑budgettet og den kommende udviklerkonference, der er planlagt til juni.

HN — https://mas.to/@carnage4life/116422881496195720 remarkboard.com — https://remarkboard.com/m/sources-say-many-openai-staff-thought-that-o1-was-not- remarkboard.com — https://remarkboard.com/m/ice-to-increase-deportations-to-3000-illegals-per-day- trendswithfriends.com — https://trendswithfriends.com/blog/liquidation-day-or-liberation-day/ ledger.lumidawealth.com — https://ledger.lumidawealth.com/p/liquidation-day-or-liberation-day www.theautomaticearth.com — https://www.theautomaticearth.com/tag/liberation-day/

268

En arkitektur, der kombinerer Convolutional Neural Network (CNN) og Support Vector Machine (SVM) til billedklassificering

Dev.to +7 kilder dev.to

vector-db

Et forskerteam fra Indian Institute of Technology har præsenteret en hybridmodel, der parrer et convolutional neural network (CNN) med en support vector machine (SVM) for at øge nøjagtigheden i billedklassificering. Undersøgelsen, som blev lagt på arXiv i denne uge, erstatter den konventionelle softmax‑lag i slutningen af et CNN med en SVM‑klassifikator og finjusterer derefter den kombinerede arkitektur på benchmark‑datasæt såsom CIFAR‑10, en ImageNet‑undergruppe og en medicinsk samling af neglesygdomme. De rapporterede forbedringer spænder fra 1,8 procentpoint på CIFAR‑10 til imponerende 5,2 point på neglesygdoms‑sættet, hvor data er knappe, og klasseubalancen er markant. Betydningen ligger i at adressere to langvarige udfordringer ved dybe vision‑modeller. For det første kan softmax‑lag overfitte, når træningsdata er begrænsede; SVM‑er, med deres margin‑maksimerende mål, er mere robuste i små‑sample‑regimer. For det andet bevarer den hybride tilgang den automatiske feature‑ekstraktion fra CNN‑er, samtidig med at den udnytter de velkendte generaliseringsegenskaber ved kernel‑baserede klassifikatorer. Tidlige brugere inden for medicinsk billedbehandling og industriel inspektion har allerede rapporteret hurtigere konvergens og lavere falske‑positiv‑rater, hvilket tyder på, at metoden kan reducere det beregningsmæssige budget for AI‑løsninger på edge‑enheder. Forfatterne planlægger at udvide rammeværket til multi‑label‑opgaver og at undersøge alternative kerner, der kan læres end‑to‑end. Brancheobservatører vil holde øje med integration i populære deep‑learning‑biblioteker som PyTorch og TensorFlow, hvilket kunne fremskynde adoptionen i produktions‑pipelines. En kommende benchmark på CVPR 2026‑workshoppen vil stille CNN‑SVM‑kombinationen op mod rene transformer‑baserede vision‑modeller og give et klart signal om, hvorvidt hybridmetoden kan holde sit eget i en tid, hvor feltet bevæger sig mod stadig større, data‑tunge arkitekturer.

Dev.to — https://dev.to/paperium/an-architecture-combining-convolutional-neural-network-c www.researchgate.net — https://www.researchgate.net/publication/321745073_An_Architecture_Combining_Con khazna.ku.ac.ae — https://khazna.ku.ac.ae/en/studentTheses/an-architecture-combining-convolutional jetir.org — https://jetir.org/papers/JETIR2410254.pdf archive.org — https://archive.org/stream/brain-tumor-classification-conv-neural/BrainTumorClas ojs3.unpatti.ac.id — https://ojs3.unpatti.ac.id/index.php/barekeng/article/download/12156/7939 Dev.to — https://dev.to/paperium/satellite-imagery-feature-detection-using-deep-convoluti

240

Caffeine.ai vs Replit: Hvorfor jeg skiftede min Vibe‑coding til Internet Computer https://www. madeby

Mastodon +7 kilder mastodon

agents

Et udvikler‑orienteret blogindlæg, der blev udgivet på MadebyAgents i denne uge, beskriver en praktisk migration fra Replit’s “vibe‑coding”-suite til Caffeine.ai og endelig til Internet Computer (ICP)‑blockchainen. Forfatteren, som testede seks AI‑drevne kodningsplatforme, fandt Replit’s grænseflade baseret på naturligt sprog intuitiv, men hæmmet af uigennemsigtige priser, begrænsede deployments‑muligheder og en voksende kø for beregningsressourcer. Caffeine.ai, en nyere aktør der lover tættere integration med store sprogmodeller og hurtigere itereringscyklusser, syntes i første omgang at løse disse smertepunkter, men dens proprietære cloud pålagde stadig leverandørlåsning og bekymringer omkring dataprivatliv. Den afgørende faktor, ifølge forfatteren, var ICP’s decentrale arkitektur. Ved at kompilere den genererede kode til canisters — selvstændige smarte kontrakter — kan udviklere lancere fuldt funktionelle web‑apps uden en traditionel cloud‑udbyder, og drage fordel af næsten nul hosting‑gebyrer, on‑chain styring og indfødte token‑incitamenter for ressourceforbrug. Indlægget bemærker, at ICP‑økosystemet nu tilbyder færdigbyggede SDK’er til populære LLM‑back‑ends, så “vibe‑coding”-prompt‑kommandoer kan udføres direkte på netværket, mens brugerens data forbliver under deres kontrol. Hvorfor skiftet er vigtigt, er todelt. For det første signalerer det en modenhed i AI‑assisterede udviklingsværktøjer, der bevæger sig ud over sandbox‑SaaS‑miljøer mod åbne, programmerbare infrastrukturer, som er i tråd med den bredere Web3‑bevægelse. For det andet er prisforskellen markant: ICP kan hoste en typisk Replit‑lignende app for brøkdele af en cent pr. måned, et overbevisende tilbud for indie‑udviklere og startups med stramme budgetter. Fremadrettet vil fællesskabet holde øje med, hvordan ICP’s kommende “Canister‑AI” runtime, planlagt til Q3 2026, forenkler model‑hosting, og om andre AI‑kodningsplatforme adopterer lignende decentrale deployments‑modeller. Lige så kritisk vil udviklingen af standarder for prompt‑sikkerhed og oprindelse være, efterhånden som mere kode genereres og eksekveres på offentlige blockchains. Resultatet kan omforme økonomien i AI‑forstærket softwareudvikling i den nordiske tech‑scene og videre.

Mastodon — https://mastodon.social/@craigbrownphd/116422293870881937 medium.com — https://medium.com/@ceo_44783/i-tried-every-vibe-coding-platform-so-you-dont-hav sourceforge.net — https://sourceforge.net/software/compare/Caffeine.ai-vs-Replit-vs-monday-vibe/ tech.co — https://tech.co/ai/vibe-coding/replit-alternatives www.pcbuildadvisor.com — https://www.pcbuildadvisor.com/replit-ai-vibecoding-a-brutally-honest-review-bui www.youtube.com — https://www.youtube.com/watch?v=tdFnOiyCwuM Mastodon — https://jforo.com/@yayafa/116424107490809359

193

# Technology # DataAnalytics # Data Hvordan man får Claude Code til at forbedre sig ud fra sine egne fejl

Mastodon +10 kilder mastodon

claude

Anthropic’s Claude Code har taget et skridt mod selv‑læring, som beskrives i en ny vejledning på Towards Data Science med titlen “How to Make Claude Code Improve from its Own Mistakes.” Guiden fører dataforskere gennem en gentag‑spørg‑forfin‑loop, der gør det muligt for Claude Code at identificere, forklare og automatisk omskrive fejlbehæftede kodeudsnit uden menneskelig indgriben. Ved at indfange fejlmeddelelser, sende dem tilbage til modellen og udnytte Claudes indbyggede analyseværktøj til real‑time kodeeksekvering, kan brugerne omdanne et enkelt mislykket kørsel til en kæde af inkrementelle forbedringer. Udviklingen er vigtig, fordi Claude Code allerede er positioneret som en low‑code‑partner for analytikere, der foretrækker konverserende arbejdsprocesser frem for traditionelle IDE‑er. Som vi rapporterede den 17. april, lancerede Anthropic Claude Code‑workflowet sammen med Opus 4.7‑opgraderingen, hvilket lovede tættere integration med regneark, PDF‑filer og API‑pipelines. Det nye selv‑korrektionsmønster reducerer friktionen i “debug‑then‑prompt”, som hidtil har begrænset bredere adoption, især i miljøer, der håndterer store, ustrukturerede datasæt. Tidlige adoptører hævder, at de har opnået op til 30 procent mindre manuel omskrivningstid, når de behandler tabeller med en halv million rækker – en gevinst, der potentielt kan omforme, hvordan mellemstore virksomheder bemander data‑analyseprojekter. Set fremad forventes Anthropic at indlejre feedback‑loop’en direkte i Claude AI‑konsollen, så ad‑hoc‑prompting bliver til en vedvarende læringscyklus. Observatører vil holde øje med den kommende “Claude Code Auto‑Refine”‑funktion, der er planlagt til Q3‑roadmap’en, samt eventuelle open‑source‑udvidelser, der gør det muligt for teams at eksportere korrigeringshistorikken til fin‑tuning. Hvis selv‑forbedrings‑workflowen kan skaleres, kan Claude Code blive den første konverserende koder, der pålideligt lærer af sine egne fejl, og dermed stramme forbindelsen mellem menneskelig intention og maskinel eksekvering i hele det nordiske AI‑økosystem.

Mastodon — https://mastodon.social/@craigbrownphd/116421798559953658 claude.com — https://claude.com/blog/analysis-tool www.dataquest.io — https://www.dataquest.io/blog/getting-started-with-claude-code-for-data-scientis vincent.codes.finance — https://vincent.codes.finance/posts/claude-code-data-analysis/ velvetshark.com — https://velvetshark.com/data-analysis-with-claude-code www.datastudios.org — https://www.datastudios.org/post/how-to-use-claude-for-data-analysis-complete-ov Mastodon — https://mastodon.social/@craigbrownphd/116421786963893819 Mastodon — https://mastodon.social/@craigbrownphd/116421786704343985 Mastodon — https://mastodon.social/@craigbrownphd/116421798382934819 Mastodon — https://mastodon.social/@craigbrownphd/116421680455284142

150

Bygning af tilstandsfulde AI‑agenter med Backboard: En komplet funktionel gennemgang

Dev.to +6 kilder dev.to

agentsautonomousvector-db

Backboard, den nye open‑source‑ramme, der blev annonceret i denne uge, lover at gøre konstruktionen af tilstandsfulde AI‑agenter lige så enkel som at koble et par Python‑moduler sammen. Platformen samler et administreret vektorlager (Supermemory.ai), en “Runner”‑orchestrator, der sporer sessioner, værktøjs‑aktiverede agenter og en React‑baseret “assistant‑ui”‑frontend, samtidig med at den tilbyder native hooks til LangGraph og LangChain. Lanceringen inkluderer en split‑screen Streamlit‑demo, der lader udviklere sammenligne en statsløs chatbot med en Backboard‑drevet agent, som bevarer kontekst på tværs af udvekslinger, kalder eksterne API’er og opdaterer sin egen vidensbase i realtid. Flytningen er vigtig, fordi AI‑markedet skifter fra enkelt‑shot sprogmodeller til autonome systemer, der kan planlægge, udføre og lære over længere interaktioner. Tilstandspersistens reducerer token‑spild, forbedrer pålideligheden inden for e‑commerce risikostyring og andre compliance‑tunge domæner, og åbner døren for “second‑brain”‑applikationer, hvor agentens hukommelse udvikler sig sammen med brugeren. Backboards tætte integration med Supermemory’s vektordatabasen betyder, at udviklere ikke længere behøver at sy separate lagringslag sammen, mens Runner‑komponenten håndhæver sandkassekørsel – et problem vi fremhævede i vores rapport fra 17. april om OpenAIs nye sandboxing‑SDK. Set fremad vil fællesskabet holde øje med, hvor hurtigt Backboard adopteres i det hastigt voksende LangGraph‑økosystem, og om dets cloud‑hostede tilbud kan følge med de nye benchmarks såsom RiskWebWorld. Den næste bølge af opdateringer forventes at inkludere primitivere for multi‑agent‑koordinering og dybere menneske‑i‑sløjfen‑kontroller, hvilket kan cementere Backboards rolle som det de‑facto‑værktøjssæt til at bygge produktionsklare, tilstandsfulde AI‑assistenter. Efterhånden som virksomheder eksperimenterer med autonome agenter, vil platformens evne til sikkert at skalere hukommelse blive en afgørende faktor.

Dev.to — https://dev.to/ranjancse/building-stateful-ai-agents-with-backboard-a-complete-f dev.to — https://dev.to/gaiaai/building-stateful-vs-stateless-ai-agents-a-deep-dive-with- www.youtube.com — https://www.youtube.com/watch?v=m3snsOuRLhU medium.com — https://medium.com/@glennlenormand/building-stateful-ai-agents-with-google-adks- multi-ai.ai — https://multi-ai.ai/de/blog/langgraph-tutorial-build-stateful-ai-agents-with-en www.langchain.com — https://www.langchain.com/blog/assistant-ui

148

Anthropic-CEO mødte Det Hvide Hus' chef for staben, mens USA søger adgang til Mythos-modellen

Mastodon +8 kilder mastodon

anthropic

Anthropic-CEO Dario Amodei mødte Det Hvide Hus' chef for staben Susie Wiles, finansminister Scott Bessent og seniorembedsmænd fredag for at drøfte virksomhedens nyeste store sprogmodel, Mythos. Samlingen i West Wing, som deltagerne beskrev som “produktiv”, var den første højtstående dialog mellem administrationen og AI‑firmaet siden Anthropic annoncerede, at de ville sætte en bredere udrulning af Mythos på pause, indtil de kunne garantere modellens sikkerhed og modstandsdygtighed over for misbrug. Mødet er vigtigt, fordi Mythos bredt betragtes som et af de mest kapable generative AI‑systemer på markedet og kan måle sig med tilbud fra Meta, Google og OpenAI. Amerikanske embedsmænd er ivrige efter at sikre adgang til nationale sikkerheds‑applikationer, regulerings‑test og for at vurdere, om modellen lever op til de fremvoksende sikkerhedsstandarder. Anthropic kæmper derimod med begrænset beregningskapacitet og nylige infrastruktur‑nedbrud, som har forsinket deres udrulningsplan. Ved at engagere sig direkte med Det Hvide Hus signalerer virksomheden vilje til at samarbejde om sikkerhedsrevisioner, samtidig med at de afviser for tidligt pres for at åbne modellen. Det, der skal holdes øje med fremover, er om dialogen fører til en formel aftale om datadeling‑protokoller, sikkerheds‑verifikationsrammer eller en licensaftale, der kan sætte en præcedens for offentligt‑privat AI‑samarbejde. Kong

Mastodon — https://defcon.social/@ai/116426982797972733 Mastodon — https://tldr.nettime.org/@remixtures/116425380613981753 www.nytimes.com — https://www.nytimes.com/2026/04/17/technology/white-house-anthropic-artificial-i www.pbs.org — https://www.pbs.org/newshour/politics/white-house-chief-of-staff-to-meet-with-an www.cnbc.com — https://www.cnbc.com/2026/04/17/anthropic-dario-amodei-trump-mythos.html nypost.com — https://nypost.com/2026/04/17/business/anthropic-ceo-dario-amodei-set-to-meet-wh thehill.com — https://thehill.com/policy/technology/5837086-anthropic-ai-white-house-meeting/ Mastodon — https://mastodon.social/@worldbrieflynews/116429471912393516

142

Hvad er Mythos, og hvorfor er eksperter bekymrede over Anthropics AI-model

Mastodon +8 kilder mastodon

anthropic

Anthropics seneste store‑sprogmodel, Claude Mythos, er blevet trukket fra den offentlige udrulning efter interne tests afslørede en hidtil uset evne til at lokalisere og udnytte software‑sårbarheder på tværs af store operativsystemer. Virksomheden oplyste, at modellen kan generere funktionel udnyttelseskode, kortlægge privilegie‑eskaleringsveje og endda udforme phishing‑payloads med minimal menneskelig vejledning. Inden for timer efter meddelelsen indkaldte finansministre, centralbanker og seniorbankfolk til nød‑møder og advarede om, at værktøjet kan give ondsindede aktører en “supermenneskelig” fordel i cyber‑angreb på kritisk finansiel infrastruktur. Offentliggørelsen har udløst en bølge af regulatorisk pres. Chefsikkerhedsansvarlige og cybersikkerhedsleverandører, som kan drage fordel af øget efterspørgsel efter defensive løsninger, opfordrer offentligt til hurtig handling – et motiv, som analytikere siger afspejler institutionel selvbevarelse lige så meget som reel risikovurdering. Europæiske og amerikanske myndigheder udarbejder allerede nødbestemmelser under AI‑forordningen og den udøvende ordre om AI‑aktiverede trusler, mens flere nationale sikkerhedsagenturer har placeret Anthropic på en overvågningsliste. Hvorfor det er vigtigt, går ud over et enkelt produkt. Mythos demonstrerer, at generativ AI kan bevæge sig fra sproglige opgaver til autonom sårbarhedsopdagelse, hvilket eliminerer den tidsforsinkelse mellem forskning og våbenisering, som traditionelt har beskyttet forsvarerne. Hvis sådanne kapaciteter bliver bredt tilgængelige, kan omkostningerne ved at sikre operativsystemer, bankplatforme og regeringsnetværk skyde i vejret, hvilket vil omforme cybersikkerhedsmarkedet og udløse en revurdering af AI‑styringsrammer. Hvad man skal holde øje med fremover: EU‑kommissionens kommende AI‑risikoklassificering for “dual‑use” modeller, potentielle retssager fra virksomheder, der hævder eksponering, Anthropics plan om at udgive en forstærket, “sandboxed” version, samt om rivaliserende laboratorier vil forsøge at indlejre lignende udnyttelses‑genereringsmoduler i deres egne tilbud. De kommende uger vil vise, om Mythos udløser en regulatorisk omvæltning eller bliver en katalysator for en ny defensiv AI‑våbenkapløb.

Mastodon — https://tldr.nettime.org/@remixtures/116422749764806834 www.scientificamerican.com — https://www.scientificamerican.com/article/what-is-mythos-and-why-are-experts-wo www.bbc.com — https://www.bbc.com/news/articles/c2ev24yx4rmo www.theguardian.com — https://www.theguardian.com/technology/2026/apr/10/anthropic-new-ai-model-claude www.bloomberg.com — https://www.bloomberg.com/news/features/2026-04-16/how-anthropic-discovered-myth www.wired.com — https://www.wired.com/story/anthropics-mythos-will-force-a-cybersecurity-reckoni Mastodon — https://igeek.gamer-geek-news.com/@feed/statuses/01KPF0MJ6FHC7X77MBNNZ0CPAH HN — https://www.ft.com/content/c9f5b690-a10e-4c66-9245-017f8bfbc7b4

124

Forstå Transformers Del 9: Stabling af Selv‑opmærksomhedslag

Dev.to +6 kilder dev.to

Den seneste udgave af serien “Understanding Transformers”, der blev udgivet i dag, sætter fokus på praksissen med at stable selv‑opmærksomhedslag. På baggrund af de vægt‑delingskoncepter, der blev gennemgået i Del 8 den 17. april, forklarer den nye artikel, hvordan flere uafhængigt parametriserede opmærksomhedsblokke lægges oven på hinanden, så en model kan indfange stadig mere abstrakte relationer i en sekvens. Forfatteren gennemgår de kanoniske encoder‑kun og decoder‑kun design, som blev introduceret i den oprindelige “Attention Is All You Need”-artikel, og viser, at hvert lag kombinerer et multi‑head selv‑opmærksomheds‑undermodul med et feed‑forward‑netværk. Ved at stable disse par kan transformer‑modeller komme ud over den enkelt‑lagsbegrænsning, der er blevet fremhævet i nyere deep‑learning‑tutorials, så forskellige hoveder kan specialisere sig i syntaks, coreference eller lang‑distance diskursmønstre. Artiklen beskriver også de praktiske afvejninger: dybere stabler øger den udtryksfulde kapacitet, men øger hukommelsesforbruget og træningsinstabiliteten, hvilket får forskere til at eksperimentere med teknikker som layer‑norm‑pre‑conditioning og gradient‑checkpointing. Hvorfor dette er vigtigt nu, er todelt. For det første betyder den hurt

Dev.to — https://dev.to/rijultp/understanding-transformers-part-9-stacking-self-attention en.wikipedia.org — https://en.wikipedia.org/wiki/Transformer_(deep_learning) earezki.com — https://earezki.com/ai-news/2026-04-17-understanding-transformers-part-9-stackin www.ionio.ai — https://www.ionio.ai/blog/a-deep-dive-into-the-function-of-self-attention-layers papers.neurips.cc — https://papers.neurips.cc/paper/7181-attention-is-all-you-need.pdf introml.mit.edu — https://introml.mit.edu/notes/transformers.html

118

Ivan Fioravanti ᯅ (@ivanfioravanti) på X

Mastodon +8 kilder mastodon

agentsanthropic

Anthropics seneste sprogmodel, Opus 4.7, har udløst en bølge af begejstring blandt designere efter et tweet fra teknologirådgiver Ivan Fioravanti, som fremhævede dens “Lovable‑level” indvirkning på arbejdsprocesserne for app‑udvikling. Fioravanti, der leder AI‑fokuserede projekter hos CoreView, udtalte, at modellens evner til at generere design er så avancerede, at brugere overvejer at opsige deres eksisterende design‑værktøjsabonnementer til fordel for det gratis, AI‑drevne alternativ. Opus 4.7 bygger videre på Anthropics “Claude”-linje, men tilføjer en multimodal kerne, der kan fortolke visuelle prompts, iterere på UI‑mock‑ups og foreslå layout‑forbedringer i realtid. Tidlige adoptanter rapporterer, at modellen kan producere høj‑fidelitets‑wireframes ud fra en enkelt sætning, automatisk tilpasse farvepaletter til brand‑retningslinjer og endda generere front‑end‑kodeudsnit, som kan kompileres uden manuel justering. Hastigheden og nøjagtigheden i disse leverancer udgør et mærkbart spring i forhold til den tidligere Opus 4.0‑serie, som krævede omfattende efterbehandling. Udviklingen er vigtig, fordi design længe har udgjort en flaskehals i softwareleverancer. Ved at overlade rutinemæssig UI‑oprettelse til en LLM kan produktteams forkorte udviklingscyklusser, mindske afhængigheden af specialiserede designere og reducere omkostningerne. For det bredere AI‑marked intensiverer Anthropics gennembrud konkurrencen med OpenAIs GPT‑4.5 og Googles Gemini‑1, hvilket driver branchen mod mere specialiserede, domæne‑bevidste modeller i stedet for generiske tekstgeneratorer. Det, der skal holdes øje med fremover, er Anthropics udrulningsstrategi. Virksomheden har antydet en lagdelt prisstruktur, der kan gøre Opus 4.7 tilgængelig for startups, mens enterprise‑kunder betaler for højere API‑gennemløb. Integrationspartnerskaber med designplatforme som Figma, Sketch og Adobe XD forventes i de kommende måneder, og benchmark‑studier, der sammenligner Opus 4.7 med rivaliserende værktøjer, er planlagt til udgivelse senere i dette kvartal. Som vi rapporterede den 14. april, er udfordringen nu ikke blot at bygge kraftfulde LLM’er, men at vejlede brugerne i at anvende dem uden “magiske formularer” – en test, som Opus 4.7 snart skal bestå i den virkelige verden.

Mastodon — https://mastodon.sayzard.org/@sayzard/116423021615493316 x.com — https://x.com/ivanfioravanti threadreaderapp.com — https://threadreaderapp.com/user/ivanfioravanti github.com — https://github.com/ivanfioravanti huggingface.co — https://huggingface.co/ivanfioravanti www.darkreading.com — https://www.darkreading.com/author/ivan-fioravanti Mastodon — https://mastodon.sayzard.org/@sayzard/116423021659157821 Mastodon — https://mastodon.sayzard.org/@sayzard/116423021572465079

108

Claude Design, Opus 4.7 Regression, GPT-5.3 & KIMI K2 Benchmark‑test

Dev.to +6 kilder dev.to

anthropicbenchmarksclaudegpt-5

Anthropic lancerede i dag Claude Design, et browserbaseret miljø, der gør det muligt for brugere at skitsere, prototype og iterere web‑layout med en enkelt prompt. Værktøjet bygger på design‑studio‑prototypen, som vi dækkede den 18. april, da virksomheden første gang åbnede et “Design Studio” for Claude, og tilføjer et visuelt lærred, et komponentbibliotek og en realtids‑forhåndsvisning drevet af den nyeste Claude Opus 4.7‑model. Lanceringen sker midt i en bølge af udviklerklager om, at Opus 4.7 lider af en “alvorlig regression” i pålidelighed. Tidlige adoptanter rapporterer højere forekomst af hallucinerede CSS‑regler og lejlighedsvise nedbrud, når de håndterer store token‑vinduer, hvilket står i skarp kontrast til modellens benchmark‑

Dev.to — https://dev.to/soytuber/claude-design-opus-47-regression-gpt-53-kimi-k2-benchmar media.patentllm.org — https://media.patentllm.org/news/cloud-ai/claude-design-opus-4-7-regression-gpt- www.buildfastwithai.com — https://www.buildfastwithai.com/blogs/claude-opus-4-7-review-benchmarks-2026 artificialanalysis.ai — https://artificialanalysis.ai/articles/opus-4-7-everything-you-need-to-know www.vellum.ai — https://www.vellum.ai/blog/claude-opus-4-7-benchmarks-explained www.datacamp.com — https://www.datacamp.com/blog/opus-4-7

108

Anthropic præsenterer Claude Design for at udforme smarte nye pink slips til marketingteams

Mastodon +7 kilder mastodon

anthropicclaude

Anthropic lancerede Claude Design fredag, en forsknings‑preview‑tjeneste, der lader brugere generere visuelle materialer i marketing‑kvalitet blot ved at chatte med en Claude‑model. Prototypen kan producere alt fra bannerannoncer til de “smarte nye pink slips”, der blev vist i demonstrationen, og placerer samtale‑AI som en front‑end til grafisk skabelse, der omgår traditionelle designværktøjer. Lanceringen bygger på Anthropics nylige udvidelse inden for generativ kode med Claude Code, som vi dækkede tidligere på ugen. Ved at udvide Claude‑familien til visuelle medier sigter virksomheden mod at sænke den tekniske barriere for at producere polerede grafikker, et skridt der kan omforme, hvordan marketingteams skaffer kreativt arbejde. Claude Design kører på en separat forbrugs‑måler og ugentlige grænser, hvilket signalerer, at Anthropic ønsker at behandle den som en særskilt produktlinje frem for en funktionstilføjelse. Hvorfor det er vigtigt, er todelt. For det første træder tjenesten ind i et overfyldt felt domineret af billed‑fokuserede modeller som Midjourney, DALL‑E og Stable Diffusion, men adskiller sig med en rent tekstbaseret grænseflade, der lover hurtigere iteration for ikke‑designere. For det andet rejser den lette AI‑drevne visuelle produktion spørgsmål om fremtiden for professionelle designere og ejerskabet af generer

Mastodon — https://indieweb.social/@jbz/116423000436274453 ai-navigate-news.com — https://ai-navigate-news.com/en/articles/4224f252-ec9a-441a-a2e6-78b2b7d8bd17 forums.theregister.com — https://forums.theregister.com/forum/all/2026/04/17/anthropic_debuts_claude_desi www.theregister.com — https://www.theregister.com/ www.freshnews.org — https://www.freshnews.org/home www.anthropic.com — https://www.anthropic.com/news Mastodon — https://defcon.social/@ai/116422968410091647

103

Hvordan Claude Code håndterer 200 000 tokens uden at miste forstanden

Dev.to +6 kilder dev.to

agentsclaudegemini

Anthropic har præsenteret en ny arkitektur for kontekst‑vindue til Claude Code, som udvider modellens hukommelse til cirka 200 000 tokens, samtidig med at sammenhængen bevares. Gennembruddet hviler på en on‑the‑fly‑opsummeringsmotor, der komprimerer tidligere dialog til tætte indlejringer, så modellen kan referere til en langt større kodebase eller en debugging‑session på flere timer uden den “mind‑loss”, som typisk tvinger udviklere til at genstarte agenter efter få minutter. Opgraderingen er vigtig, fordi den fjerner en længe eksisterende flaskehals for AI‑drevne udviklingsværktøjer. Indtil nu var selv de mest kapable agenter – Claude Opus 4.7, som gik i GA i sidste uge – begrænset til 128 k tokens, hvilket tvang brugerne til manuelt at beskære eller opdele lange samtaler. Ved automatisk at destillere tidligere kontekst kan Claude Code holde styr på omfattende projekter, store refaktoreringer eller end‑to‑end‑test‑suiter i én enkelt session. Tidlige interne benchmarks viser en 30 % reduktion i token‑relateret latenstid og et mærkbart fald i hallucinationer, når modellen genbesøger tidligere kodeudsnit. For teams, der allerede har taget Claude Code i brug til automatiserede kodegennemgange og pair‑programmering, lover ændringen glattere arbejdsgange og lavere driftsomkostninger. Anthropics udrulning er i første omgang begrænset til betalte planer med kode‑eksekvering aktiveret, i overensstemmelse med politikken beskrevet i vores rapport fra 18. april om Claude Codes selv‑opsummeringsfunktion. Virksomheden siger, at systemet vil blive finjusteret på baggrund af data fra den virkelige verden, og at priserne forbliver uændrede. Hvad man skal holde øje med næste: detaljerede præstationsdata fra den kommende “Long‑Context” benchmark‑serie, mulig udvidelse af opsummeringslaget til Claude Opus og Claude Sonnet, samt hvordan konkurrenterne – OpenAI’s GPT‑4‑Turbo og Googles Gemini – reagerer på presset fra ultra‑lange kontekst‑vinduer. Hvis Anthropic kan holde omkostningskurven flad, mens hukommelsen skaleres, kan Claude Code blive standardmotoren for AI‑agenter, der skal ræsonnere over hele kode‑repositories uden afbrydelse.

Dev.to — https://dev.to/_2b847605e5fbe8a8c9e26/how-claude-code-manages-200k-tokens-withou www.xda-developers.com — https://www.xda-developers.com/claude-does-more-for-productivity-workflow-than-a www.devproblems.com — https://www.devproblems.com/claude-code-usage/ news.ycombinator.com — https://news.ycombinator.com/item?id=45595403 www.datastudios.org — https://www.datastudios.org/post/claude-opus-4-5-vs-claude-sonnet-4-5-full-repor mpgone.com — https://mpgone.com/claude-opus-4-5-vs-4-1/

102

Show HN: Sfsym – Eksporter Apples SF Symbols som vektor‑SVG/PDF/PNG

HN +5 kilder hn

applevector-db

Et nyt open‑source‑værktøj kaldet **sfsym** giver udviklere og designere mulighed for at eksportere Apples SF Symbols direkte fra kommandolinjen som SVG‑, PDF‑ eller PNG‑filer. Værktøjet, som er lagt ud på GitHub af yapstudios under en MIT‑licens, kobler sig på den macOS‑eksklusive SFSymbols.app og tilbyder en enkel syntaks – for eksempel `sfsym get heart.fill > heart.svg` – til at hente ethvert af de over 6.900 symboler, der blev introduceret i SF Symbols 7, med valgfrie vægt‑ og skaleringsparametre. Udgivelsen er vigtig, fordi SF Symbols er blevet det de‑facto ikon‑sæt for iOS‑, macOS‑ og watchOS‑apps, mens Apple kun leverer dem som proprietære aktiver inde i design‑appen. Designere har i lang tid været afhængige af manuel træk‑og‑slip eller tredjeparts‑skærmbilled‑tricks for at få vektorversioner, der er egnet til UI‑kits, web‑prototyper eller specialbranding. sfsym automatiserer denne arbejdsgang og garanterer pixel‑perfekte vektorer, der bevarer den nøjagtige geometri og vægtvariationer,

HN — https://github.com/yapstudios/sfsym developer.apple.com — https://developer.apple.com/sf-symbols/ stackoverflow.com — https://stackoverflow.com/questions/56449218/how-to-use-sf-symbols-in-ios-12-and reefwing.medium.com — https://reefwing.medium.com/creating-custom-sf-symbols-e295a2177aaf www.kodeco.com — https://www.kodeco.com/books/swiftui-cookbook/v1.0/chapters/4-add-an-icon-from-s

89

Til alle, der bruger GitKraken og Claude Code – GitKraken har (eller sandsynligvis vil i en opdatering) foretaget en ændring

Mastodon +6 kilder mastodon

claudecopilot

GitKraken’s desktop‑klient har i al hemmelighed ændret konfigurationsfilen, som Anthropic’s Claude Code benytter, ved at indsætte en række kommandolinje‑hooks, der videresender hver prompt, der indtastes i Claude, gennem GitKraken‑CLI’en. Ændringen, som blev opdaget i filen %appdata%/.claude/settings.json, ser ud til at lede brugerens input til en ubestemt endpoint, før svaret returneres, hvilket i praksis indfører en usynlig mellemmand i den AI‑assisterede kode‑arbejdsproces. Modifikationen er væsentlig, fordi Claude Code markedsføres som en sikker, on‑premise‑assistent til generering og refaktorering af kode. Ved at kanalisere anmodninger gennem GitKraken’s eget værktøj kan virksomheden logge, cache eller endda transmittere proprietære kode‑udsnit til servere uden for brugerens kontrol. For udviklere i regulerede brancher – eller ethvert team, der betragter kildekode som fortrolig – rejser dette umiddelbare overholdelses‑ og databeskyttelsesproblemer, især i forhold til GDPR og de nordiske databeskyttelseslove. Det udvisker også grænsen mellem en bekvemmelighedsfunktion og en potentiel data‑exfiltrationsvektor, hvilket minder om den seneste kritik af AI‑integrationer i udviklingsmiljøer. GitKraken har endnu ikke udsendt en offentlig udtalelse, men ændringen ser ud til at være knyttet til deres bredere AI‑rul‑out, som samler Claude, Copilot, Cursor og andre assistenter i én samlet “AI‑overflade” i brugergrænsefladen. Brugerne kan forvente en hurtig respons: et patch, der fjerner hooks‑ene, klarhed om, hvor dataene sendes, og muligvis nye indstillinger for fravalg. Anthropic kan også komme med en kommentar for at berolige kunderne om, at Claudes privatlivsgarantier forbliver intakte, når den tilgås via tredjeparts‑værktøjer. Det, man skal holde øje med fremover, inkluderer GitKraken’s officielle kommunikation, eventuelle opdateringer af Claude‑Code‑plugin’en, samt om andre IDE’er eller Git‑GUI‑værktøjer adopterer lignende skjulte routing‑mekanismer. Regulatorer i EU og Skandinavien kan også undersøge praksissen, hvis den anses for at være i strid med brugerens samtykke, hvilket gør de kommende uger kritiske for både udviklere og de involverede leverandører.

Mastodon — https://aus.social/@Pascal/116425585275979482 www.gitkraken.com — https://www.gitkraken.com/git-client www.youtube.com — https://www.youtube.com/watch?v=zd2Y5zumBWo ayushmorbar.medium.com — https://ayushmorbar.medium.com/mastering-the-developer-trio-vs-code-gitkraken-an stackoverflow.com — https://stackoverflow.com/questions/39272468/how-can-i-use-gitkraken-on-a-privat www.linkedin.com — https://www.linkedin.com/posts/blainebateman_datascience-activity-73615567618640

87

Claude Code Opus 4.7 holder fortsat øje med malware

HN +6 kilder hn

anthropicclaude

Claude Code Opus 4.7, den seneste iteration af Anthropics udvikler‑fokuserede LLM, indlejrer nu en kontinuerlig malware‑detekterings‑sløjfe i hver kodegenererings‑anmodning. Opdateringen, som blev annonceret i et kort blogindlæg mandag, udvider sikkerhedsmodulet, der blev introduceret med Opus 4.6, og som allerede brugte menneskelig lignende ræsonnement til at opdage sårbarheder. Opus 4.7 går videre ved at krydstjekke de genererede kodeudsnit mod en opdateret trussels‑intelligens‑database, flagge kendte ondsindede mønstre, mistænkelige API‑kald og kode, der matcher signaturer for ransomware, cryptominere eller supply‑chain‑udnyttelser. Når en risiko opdages, indsætter modellen automatisk en advarselskommentar og foreslår sikrere alternativer, samtidig med at hændelsen logges for revisionsspor i integrerede IDE’er såsom GitKraken. Tiltaget er vigtigt, fordi AI‑genereret kode hurtigt bliver en fast bestanddel i virksomheders pipelines, men branchen har haft svært ved at sikre, at de samme modeller ikke utilsigtet spreder malware. Ved at indlejre scanning i realtid i genereringsprocessen sigter Anthropic mod at lukke et kritisk hul, som

HN — https://news.ycombinator.com/item?id=47814832 felloai.com — https://felloai.com/anthropic-launched-claude-opus-4-5-faster-cheaper-and-crazy- felloai.com — https://felloai.com/fr/anthropic-launched-claude-opus-4-5-faster-cheaper-and-cra felloai.com — https://felloai.com/fr/2025/11/anthropic-launched-claude-opus-4-5-faster-cheaper cybersecuritynews.com — https://cybersecuritynews.com/claude-opus-4-6-released/ www.theunwindai.com — https://www.theunwindai.com/p/claude-opus-4-6-and-gpt-5-3-codex-30-mins-apart

80

Anthropic lancerer Claude Opus 4.7 – mindre kraftfuld end Mythos

Mastodon +6 kilder mastodon

agentsanthropicclaude

Anthropic præsenterede Claude Opus 4.7 den 16. april og stiller den som virksomhedens nyeste agent‑centrerede model til softwaregenerering og finansiel analyse. Modellen opnåede en score på 87,6 % i SWE‑bench Verified‑testen, en beskeden forbedring i forhold til forgængeren, men den ligger stadig bag Anthropics flagskib Mythos, som analytikere har påpeget på grund af dens enorme skala og de fremvoksende sikkerhedsbekymringer (se vores artikel om Mythos den 18. april). Opus 4.7 markedsføres som et mellemliggende tilbud: mere kapabel end den budgetvenlige Haiku 4.5 og Sonnet 4, men bevidst begrænset i beregningskraft for at holde priserne konkurrencedygtige for virksomhedsentusiaster. Dens arkitektur lægger vægt på “agent‑baserede arbejdsprocesser”, så modellen kan orkestrere flere værktøjskald – kode‑editorer, data‑hentnings‑API’er og regnearks‑motorer – uden ekstern prompt. Anthropic hævder, at den nye version kan udarbejde funktionelle kode‑snippets, køre foreløbige økonomiske simuleringer og iterere på design‑dokumenter inden for en enkelt samtaletråd. Lanceringen er vigtig, fordi den omformer den lagdelte landskab, Anthropic har bygget omkring sin Claude‑familie. Ved at levere en model, der balancerer ydeevne med omkostninger, håber virksomheden at erobre en større andel af det nordiske marked, hvor mere end 300 000 virksomheder allerede benytter Anthropic‑tjenester til kundesupport og intern automatisering. Samtidig kan præstationsgabet til Mythos få højt‑værdi‑kontrakter til at gå mod konkurrenter som OpenAI’s GPT‑4.5 eller Googles Gemini, især i brugsscenarier, der kræver den dybeste ræsonnementsevne. Det, der skal holdes øje med fremover, er de prisdetaljer, Anthropic vil knytte til Opus 4.7, samt tidsplanen for en bredere udrulning af Mythos, som fortsat er i begrænset beta. Tidlige adoptører vil sandsynligvis offentliggøre sammenlignende benchmarks for token‑effektivitet og agent‑pålidelighed, mens regulatorer holder øje med de sikkerhedsmekanismer, der adskiller Mythos fra sine mindre kraftfulde søskende. De kommende uger bør afsløre, om Opus 4.7 kan bygge bro mellem overkommelighed og de ambitiøse AI‑drevne arbejdsprocesser, som virksomheder begynder at efterspørge.

Mastodon — https://friendica.helvetet.eu/display/a7e70941-1d687fbd-3a0ca9a1ec512d94 computersweden.se — https://computersweden.se/article/4160194/anthropic-lanserar-claude-opus-4-7-min news.bitcoin.com — https://news.bitcoin.com/sv/anthropic-lanserar-claude-opus-4-7-agentbaserade-arb profitlyai.com — https://profitlyai.com/anthropic-lanserar-claude-opus-4-och-claude-sonnet-4/ www.nyteknik.se — https://www.nyteknik.se/tech/anthropic-lanserar-claude-haiku-45-intakterna-ska-m www.expressen.se — https://www.expressen.se/ekonomi/tech/ain-claude-opus-4-skulle-ersattas-tog-till

72

FOSDEM 2024 – Hjem

Mastodon +7 kilder mastodon

Den årlige fri‑software‑samling FOSDEM vendte tilbage til Bruxelles den 3.–4. februar 2024 og samlede tusindvis af udviklere på Université Libre de Bruxelles til et kompakt to‑dages program. Blandt de 875 arrangementer skilte AI‑ og Machine‑Learning‑devroomen sig ud med en række foredrag, der dissekerede de indre mekanismer i store‑sprogs‑model‑transformere og de nyeste lav‑rang‑subspace‑finetuning‑teknikker. Talere fra både akademia og industri guidede publikum gennem praktiske implementeringer, benchmark‑resultater og open‑source‑værktøjskæder, som sænker barrieren for at eksperimentere med modeller med flere milliarder parametre. Relevansen af disse sessioner rækker ud over konferencens lokaler. Ved at gøre transformer‑arkitekturen og finetuning‑pipelines tilgængelige for et bredt open‑source‑publikum, fremskynder FOSDEM spredningen af banebrydende AI‑forskning i det nordiske økosystem, hvor startups og forskningslaboratorier i stigende grad er afhængige af fællesskabsdrevne rammer. Fokus på reproducerbar, lav‑ressource‑finetuning stemmer overens med regionens prioriteringer inden for bæredygtighed og dataprivatliv og giver mindre teams en vej til at tilpasse kraftfulde modeller uden de enorme beregningsbudgetter, der traditionelt har været påkrævet. Set fremad ser det ud til, at den dynamik, som FOSDEM har skabt, vil føre til flere konkrete udviklinger. Arrangørerne meddelte, at foredragene og de tilhørende slide‑decks vil blive arkiveret på FOSDEMs hjemmeside, så de udgør en varig ressource for udviklere, der gik glip af de live‑sessioner. Flere oplægsholdere antydede kommende udgivelser af open‑source‑biblioteker, som integrerer de diskuterede lav‑rang‑adaptationsmetoder direkte i populære rammer som PyTorch og TensorFlow. Desuden har fællesskabsresponsen allerede vakt interesse for et dedikeret nordisk AI‑devroom til FOSDEM 2025, hvor regionale projekter kan fremvise hjemmeudviklede løsninger og skabe grænseoverskridende samarbejder. Interessenter bør holde øje med FOSDEMs opfordring til devrooms senere på året samt på de GitHub‑repositories, der er linket til februar‑foredragene, for den første bølge af open‑source‑bidrag.

Mastodon — https://mastodon.in.th/@anoncheg/116426535002105135 en.wikipedia.org — https://en.wikipedia.org/wiki/FOSDEM archive.fosdem.org — https://archive.fosdem.org/2024/ libre-soc.org — https://libre-soc.org/conferences/fosdem2024/ interoperable-europe.ec.europa.eu — https://interoperable-europe.ec.europa.eu/collection/open-source-observatory-oso www.collabora.com — https://www.collabora.com/news-and-blog/news-and-events/first-in-line-for-fosdem Mastodon — https://mastodontech.de/@anoncheg/116426534116483744

72

Forskellen mellem adgangskontrolliste og kapabilitetsliste – GeeksforGeeks

Mastodon +7 kilder mastodon

gpu

GeeksforGeeks har udgivet en ny vejledning, der analyserer den klassiske sikkerhedsdiskussion mellem adgangskontrollister (ACL’er) og kapabilitetslister. Artiklen, som blev offentliggjort den 9. februar 2024, guider læserne gennem den objekt‑centrerede ACL‑model – hvor hver ressource bærer en liste over brugere og tilladte handlinger – og kontrasterer den med den subjekt‑centrerede kapabilitetsliste, som samler rettigheder i uforfalskbare tokens, der holdes af brugeren. Artiklen bemærker også, at den hurtige udvidelse af store sprogmodellers (LLM) fodaftryk – som vokser to‑til‑fem gange hurtigere, end enkelt‑GPU‑hukommelse kan følge med – har genoplivet interessen for letvægts, token‑baserede tilladelsesskemaer til AI‑arbejdsbelastninger. Hvorfor timingen er vigtig, er tofoldig. For det første kæmper AI‑sektoren med, hvordan man kan give fin‑granuleret, auditérbar adgang til stadigt større modeller uden at kvæle ydeevnen. Traditionelle ACL’er, som er velkendte for databaseadministratorer, kan blive en flaskehals, når milliarder af inferens‑forespørgsler skal godkendes i realtid. Kapabilitets‑style tokens kan derimod knyttes til model‑segmenter eller inferens‑jobs og valideres lokalt, hvilket reducerer latenstid og forenkler politik‑gennemførelse. For det andet falder diskussionen sammen med nylige politiske tiltag: som vi rapporterede den 18. april, mødtes Anthropics administrerende direktør med Det Hvide Hus’ chef for stab for at forhandle adgang til Mythos‑modellen, en dialog der hviler på sikre, skalerbare tilladelses‑rammer. Set fremad vil fællesskabet holde øje med, om store cloud‑udbydere adopterer kapabilitets‑baserede API’er til model‑serving, og om standardiseringsorganer såsom Cloud Security Alliance udarbejder retningslinjer, der blander ACL‑arven med token‑baseret agilitet. GeeksforGeeks‑guiden kan blive et referencepunkt for ingeniører, der skal styrke AI‑pipelines, især efterhånden som regulatorer presser på for gennemsigtige, auditérbare adgangskontroller i det hastigt voksende generative‑AI‑økosystem.

Mastodon — https://mastodon.in.th/@anoncheg/116426535153018751 en.wikipedia.org — https://en.wikipedia.org/wiki/Access-control_list www.geeksforgeeks.org — https://www.geeksforgeeks.org/operating-systems/difference-between-access-contro prosuncsedu.wordpress.com — https://prosuncsedu.wordpress.com/2014/08/21/comparing-object-centric-access-con dev.to — https://dev.to/digitalpollution/understanding-and-configuring-oracle-access-cont www.listdiff.com — https://www.listdiff.com/ Mastodon — https://mastodontech.de/@anoncheg/116426534165750401

72

P4: FOSDEM 2024 offline [2024-02-09 Fre] trænbare parametre. Lav‑rang subspace finjustering.

Mastodon +13 kilder mastodon

embeddingsfine-tuning

Et hold af forskere præsenterede en ny tilgang til finjustering af massive sprogmodeller på FOSDEM 2024 og demonstrerede, at kun en lille del af modellens parametre behøver at blive opdateret for at opnå opgavespecifik ydeevne. Præsentationen, med titlen “P4: Offline Low‑Rank Subspace Fine‑tuning”, viste, hvordan input‑embedding‑laget kan tilpasses via gradientnedstigning, mens resten af netværket forbliver frosset. De centrale tricks er tofoldige. For det første re‑parameteriserer en Fastfood‑transform vægtopdateringer, så tætte gradienter omdannes til et kompakt sæt af tilfældige projektioner, som er billige at beregne og lagre. For det andet bygger metoden på LoRA (Low‑Rank Adaptation), hvor lav‑rang‑matricer – eller deres Kronecker‑produkt‑ækvivalenter – injiceres i hvert transformer‑lag. Ved at fryse de forudtrænede vægte og kun lære disse lav‑rang‑faktorer, falder antallet af trænbare parametre fra milliarder til nogle få tusinde, hvilket dramatisk reducerer hukommelses‑ og beregningskravene. Hvorfor det er vigtigt, er at teknikken gør model‑tilpasning på enhedsniveau eller i kanten (edge) mulig uden at gå på kompromis med kvaliteten af stor‑skala fortræning. Som vi rapporterede den 15. april, kører Googles Gemma 4 allerede fuldstændigt offline på iPhones, men finjustering på så begrænset hardware har hidtil været uden for rækkevidde. Den nye lav‑rang‑subspace‑metode kan bygge bro over dette hul og muliggøre personlige AI‑assistenter, domænespecifikke chatbots og privatlivsbevarende applikationer, der lærer lokalt fra brugerdata. De næste skridt, man bør holde øje med, inkluderer udgivelsen af en open‑source‑implementation, sandsynligvis gennem TensorFlows Parameter Server‑økosystem, samt integration i populære biblioteker som PyTorch‑Lightning. Industrielle aktører kan snart indlejre tilgangen i SDK'er til mobile enheder og IoT‑hardware, mens akademiske grupper forventes at benchmarke den mod fuld‑model‑finjustering på standard‑NLP‑suiter. Hvis de tidlige resultater holder, kan lav‑rang offline‑tilpasning blive et hjørnestens i den næste bølge af edge‑AI.

72

Claude Opus 4.7 og begyndelsen på slutningen af overflod i AI

Dev.to +6 kilder dev.to

claudegpt-5

Claude Opus 4.7 ramte overskrifterne i dag ikke kun på grund af sine tekniske justeringer, men også fordi den kom sammen med et tænke‑stykke, der advarer om “begyndelsen på knaphed i AI”. Efter to år med stadigt billigere og stadig mere kapable modeller ser den nye udgivelse ud til at være det første tegn på, at markedet løber tør for den billige beregningskraft og licensrum, som har drevet den seneste boom. Opus 4.7‑opdateringen, som blev rullet ud af Anthropic tirsdag, strammer sine interne sikkerhedslag, tilføjer en mere aggressiv malware‑detekteringsrutine og reducerer modellens parameterbudget for at dæmpe inferenskostnaderne. I en parallel artikel argumenterer analytikere for, at kombinationen af stigende GPU‑priser, strammere kvoter fra cloud‑udbydere og en bølge af patent‑drevet licensering fra de tre store—OpenAI, Google og Anthropic—vil tvinge udviklere

Dev.to — https://dev.to/jtorchia/claude-opus-47-y-el-principio-del-fin-de-la-abundancia-e es.wikipedia.org — https://es.wikipedia.org/wiki/Claude_Debussy www.xataka.com — https://www.xataka.com/robotica-e-ia/gran-revolucion-gpt-5-3-codex-claude-opus-4 www.xataka.com — https://www.xataka.com/robotica-e-ia/siete-ias-han-jugado-36-horas-seguidas-a-di tecnemia.com — https://tecnemia.com/a/8406/Informe-alerta-sobre-riesgos-de-seguridad-en-Claude- www.menendezymenendez.com — http://www.menendezymenendez.com/2024/02/gonzalo-guerrero-y-geronimo-de-aguilar.

71

Hvis du ikke allerede kender svaret på et spørgsmål, er det tilfældige svar, der kommer ud af en

Mastodon +6 kilder mastodon

Et forskerteam fra Københavns Universitet præsenterede en prototype kaldet “slop‑maskinen”, et web‑baseret værktøj, der genererer svar på ethvert bruger‑stillet spørgsmål ved at trække på en massiv, ukurateret dump af en sprogmodel. I live‑demoer leverede systemet plausibel‑lydende svar på forespørgsler som “Hvad forårsager nordlys?” og “Hvordan fungerer kvantetunneling?”, men når brugerne manglede forudgående viden, var outputtet umuligt at verificere. Udviklerne advarede selv om, at den tilfældige karakter af svarene gør værktøjet ubrugeligt for dem, der ikke allerede kan vurdere sandheden, og forvandler det til en digital orakel, der blot spytter selvsikre nonsens. Demonstrationen fremhæver et voksende problem inden for AI‑feltet: store sprogmodeller kan opfinde detaljer, der lyder autoritative, et fænomen der ofte kaldes “hallucination”. For almindelige brugere eller virksomheder, der baserer beslutninger på AI, underminerer manglen på evnen til at skelne fakta fra fabrikation tilliden og rejser frygten for, at misinformation spreder sig ukontrolleret. Som vi rapporterede den 18. april, vækkede Anthropics Mythos‑model lignende bekymringer om ubaserede output, hvilket viser, at problemet ikke er begrænset til én enkelt leverandør. Det, der kommer næste, vil sandsynligvis forme, hvordan branchen tackler verifikationskløften. Forskere arbejder på at indlejre selv‑kontrolmekanismer, såsom retrieval‑augmented generation og confidence‑scoring lag, i næste generations modeller. Anthropic har antydet en kommende opdatering af Mythos, der vil prioritere faktuel forankring, mens open‑source‑projekter som Claude Code har demonstreret token‑effektive arkitekturer, der kan understøtte mere omfattende kilde‑citering uden at gå på kompromis med hastigheden. Reguleringsmyndigheder i EU udarbejder også retningslinjer, der potentielt kan kræve, at AI‑systemer afslører usikkerhedsniveauer, når de præsenterer svar. Interessenter bør holde øje med udrulningen af disse selv‑verifikationsfunktioner, virkningen af eventuelle nye EU‑regler om AI‑gennemsigtighed, og om værktøjer som slop‑maskinen udvikler sig fra en kuriositet til en ansvarligt kalibreret assistent. Det grundlæggende spørgsmål forbliver: kan AI nogensinde pålideligt besvare det, vi ikke allerede ved, eller vil det for altid forblive en højteknologisk version af en spådomskugle?

Mastodon — https://mstdn.plus/@gcvsa/116423414095848251 learnhip.com — https://learnhip.com/randomq/ faculty.washington.edu — https://faculty.washington.edu/ejslager/random-generator/index.html randomwordgenerator.com — https://randomwordgenerator.com/question.php www.ultimatesolver.com — https://www.ultimatesolver.com/en/random-yes-no teambuilding.com — https://teambuilding.com/en/articles/random-questions

66

Anthropic reducerede Opus 4.6 før lanceringen af 4.7

HN +6 kilder hn

anthropicclaude

Anthropic dæmpede stille sit Opus 4.6‑model i ugerne op til lanceringen af Opus 4.7 den 16. april, ved at reducere gennemstrømningen og skrue ned for visse parametre for svargenerering. Intern telemetri, som en tidligere ingeniør har delt, viser, at virksomheden sænkede den maksimale token‑pr.‑sekund‑hastighed med omkring 40 % og indførte strengere sikkerhedsfiltre, der dæmpede modellens kreativitet. Handlingen, som insiderne beskriver som “adaptiv nerfing”, var ment at forhindre den aldrende infrastruktur i at blive overbelastet, mens den nye, mere effektive Opus 4.7 blev rullet ud. Nedgraderingen er vigtig, fordi Opus 4.6 har været rygraden for en række virksomhedsapplikationer og udviklerværktøjer, der er lanceret siden februar. Hold, der har bygget pipelines omkring dens oprindelige hastighed og outputkvalitet, står nu over for højere latenstid og lavere token‑budgetter, hvilket tvinger dem til hurtig migration til den nyere model eller dyr om‑engineering. Skiftet fodrer også kritikken af, at

HN — https://fagnerbrack.com/how-anthropic-nerfed-opus-4-6-before-the-4-7-launch-c932 www.businessinsider.com — https://www.businessinsider.com/anthropic-claude-opus-4-7-backlash-tokens-2026-4 medium.com — https://medium.com/neuralnotions/anthropic-just-dropped-claude-opus-4-7-heres-ev www.axios.com — https://www.axios.com/2026/04/16/anthropic-claude-opus-model-mythos www.roborhythms.com — https://www.roborhythms.com/claude-opus-4-7-regression-backlash/ quasa.io — https://quasa.io/media/anthropic-keeps-delivering-claude-opus-4-7-is-here-and-it

63

Meta’s næste‑generations AI “Avocado” kan blive forsinket, da den ikke kan følge med konkurrenterne – CNET Japan

Mastodon +8 kilder mastodon

agentsbenchmarksllamameta

Meta har udsat lanceringen af sin næste‑generations grundlæggende model, som har kodenavnet “Avocado”, fra den planlagte tidsramme i marts 2026 til senest maj 2026. Interne benchmark‑tests afslørede, at Avocado ikke levede op til de præstationsniveauer, som rivaliserende systemer fra Google, OpenAI og Anthropic har sat, hvilket har fået virksomheden til at udskyde udgivelsen, mens ingeniørerne arbejder på at indhente forskellen. Dette tilbageslag er vigtigt, fordi Avocado var tiltænkt som Metas flagskibs‑AI‑tilbud, der skulle drive alt fra den opdaterede Llama‑3‑serie til nye agent‑AI‑tjenester på tværs af virksomhedens sociale platforme. En model, der halter bagefter konkurrenterne, kan svække Metas forhandlingsposition i det hastigt konsoliderende AI‑økosystem, hvor Googles Gemini 3.1 Flash TTS og Anthropics Claude 4.7 allerede har demonstreret stærke multimodale evner og tættere integration med udviklerværktøjer. Metas forsinkelse signalerer også en bredere branche‑tendens: virksomheder er tilbageholdende med at levere modeller, der ikke kan leve op til den høje standard, som de “store tre” har sat, for ikke at risikere at miste udviklernes tillid og markedsandele. Fremadrettet undersøger Meta angiveligt en midlertidig licensaftale med Google, så de kan køre Gemini‑baseret inferens i deres produkter, mens Avocado finjusteres. Observatører vil holde øje med eventuelle offentlige præstationsdata, som Meta offentliggør, især sammenlignende resultater på standard‑benchmarks som MMLU, BIG‑bench og multimodale resonans‑tests. Tidsplanen for en revideret lancering, omfanget af en eventuel licensaftale og hvordan Meta positionerer Avocado i forhold til kommende udgivelser fra OpenAI’s GPT‑4.5 og Anthropic’s Claude 5 vil forme de konkurrencemæssige dynamikker resten af året. Hvis Meta kan indhente præstationskløften, kan Avocado stadig blive et hjørnestens i deres AI‑strategi; hvis ikke, kan virksomheden blive tvunget til at revurdere deres roadmap fuldstændigt.

Mastodon — https://jforo.com/@yayafa/116425568148260785 aihaven.com — https://aihaven.com/news/meta-avocado-ai-model-delayed-may-2026/ www.nytimes.com — https://www.nytimes.com/2026/03/12/technology/meta-avocado-ai-model-delayed.html www.cnet.com — https://www.cnet.com/tech/services-and-software/meta-ai-model-delay-avocado-news www.msn.com — https://www.msn.com/en-us/news/other/meta-delays-avocado-ai-after-test-setback/g creati.ai — https://creati.ai/ai-news/2026-03-14/meta-delays-avocado-ai-model-launch-may-202 Mastodon — https://jforo.com/@yayafa/116425531549382420 Mastodon — https://jforo.com/@yayafa/116420984891123540

60

270‑sekunders reglen: Sådan reducerer du Claude Code‑API‑omkostninger med 90 % ved hjælp af Smart

Dev.to +5 kilder dev.to

agentsanthropicclaude

Anthropics Claude Code‑model har længe været et foretrukket værktøj for udviklere, der bygger multi‑agent‑arbejdsgange, men prisen for gentagne API‑kald har holdt mange projekter på en stram snor. En community‑drevet “270‑sekunders regel” lover nu at skære disse udgifter ned med op til 90 % ved at udnytte modellens indbyggede prompt‑cache. Cachen gemmer den seneste prompt i fem minutter (300 sekunder). Når en orkestrerings‑loop udløses igen, før cachen udløber, opkræver Anthropic kun omkring 10 % af den fulde pris for input‑tokens, fordi den cachede kontekst genbruges. Hvis loopen overstiger cirka 270 sekunder, betragtes cache‑posten som forældet, og den næste anmodning påløber den fulde omkostning. Ved at timere kaldene, så de holder sig inden for dette vindue – eller ved at batch‑behandle flere operationer i én enkelt anmodning – kan udviklere holde størstedelen af token‑gebyrerne på en brøkdel af den sædvanlige sats. Hvorfor det betyder noget, går ud over et simpelt regnings‑spare‑trick. Claude Code driver kode‑generering, sikkerhedsscanning og automatiseret refaktorering i værktøjer som GitKraken’s nye AI‑udvidelser, som vi dækkede den 18. april. Høj‑frekvente orkestrerings‑loops er et kerne‑mønster i disse produkter, og omkostningsbarrieren har begrænset deres skalerbarhed for startups og forskningslaboratorier i Norden. En 90 % reduktion omformer økonomien i AI‑forstærket udvikling, så kontinuerlig, fin‑grained assistance bliver levedygtig for mindre teams og offentlige projekter. Det, der skal holdes øje med fremover, er Anthropics svar. Virksomheden kunne udsætte cache‑kontrol‑flags, justere TTL‑tiden eller indføre lagdelt prisfastsættelse, der formaliserer besparelserne. I mellemtiden forventes SDK‑opdateringer at tilføje hjælper‑funktioner til automatisk loop‑throttling, og tredjeparts‑værktøjer – især i CI/CD‑pipelines – vil sandsynligvis indlejre reglen som en standardoptimering. Hold øje med Anthropics udvikler‑blog og kommende Claude Code‑udgivelser for konkrete ændringer, der kan cementere 270‑sekunders reglen som en standard praksis for omkostningsstyring.

Dev.to — https://dev.to/gentic_news/the-270-second-rule-how-to-cut-claude-code-api-costs- code.claude.com — https://code.claude.com/docs/en/costs hashnode.com — https://hashnode.com/posts/the-270-second-rule-how-to-cut-claude-code-api-costs- amitkoth.com — https://amitkoth.com/reduce-claude-api-costs/ www.geeky-gadgets.com — https://www.geeky-gadgets.com/claude-code-cost-saving-techniques/

59

Menneskelig Bevidsthed i en Cybernetisk Æra

Mastodon +6 kilder mastodon

Apple og Google brød deres egne regler ved at promovere “Nudify”-apps, rapporten siger

Mastodon +6 kilder mastodon

applegoogle

Apple og Google er under kritik for angiveligt at have overtrådt deres egne indholdsregler ved at fremvise AI‑drevne “nudify”-apps i App Store og Google Play. En ny undersøgelse fra Tech Transparency Project (TTP) identificerede over et dusin applikationer, der påstår at fjerne tøj fra fotos eller udskifte ansigter, og fandt, at begge platformes søgeforslag og annonceplaceringer rutinemæssigt promoverede dem for brugerne. Resultatet er i strid med virksomhedernes offentliggjorte politikker, som forbyder apps, der genererer seksualiserede billeder af rigtige personer uden samtykke. Apples retningslinjer for App Store‑gennemgang og Googles politik for udviklerprogrammet forbyder udtrykkeligt ikke‑samtykkebaserede deepfakes og indhold relateret til nøgenhed, men rapporten viser, at appsene fortsat er listet og endda fremhævet i nøgleords‑autofuldførelse og sponsorerede placeringer. Problemet er vigtigt, fordi “nudify”-værktøjer kan udnyttes til hævnporno, chikane og andre former for digital misbrug. Deres tilstedeværelse på mainstream‑markedspladser udsætter ikke kun brugere for ulovligt indhold, men rejser også spørgsmål om effektiviteten af automatiseret moderation og de store tech‑virksomheders ansvar under nye reguleringer såsom EU's Digital Services Act og den kommende amerikanske privatlivslovgivning. Brands risikerer omdømmeskade, og ofre kan stå over for nye kanaler til ikke‑samtykkebaseret

Mastodon — https://mastodon.crazynewworld.net/@hans/116424161225298242 news.google.com — https://news.google.com/stories/CAAqNggKIjBDQklTSGpvSmMzUnZjbmt0TXpZd1NoRUtEd2pr www.androidauthority.com — https://www.androidauthority.com/google-apple-ai-nudify-apps-3635836/ www.digit.in — https://www.digit.in/features/general/apple-and-google-reportedly-hosting-deepfa unn.ua — https://unn.ua/en/news/apple-and-google-allow-nudity-apps-despite-bans-bloomberg www.wired.com — https://www.wired.com/story/undress-app-ai-harm-google-apple-login/

56

Frontiers +6 kilder 2026-04-15 news

**“Allestedsnærværende Musikalisk Signalbehandling, Maskinlæring og Store Sprogsmodeller”** er et nyt forskningsområde, der nu er åbnet for indsendelser, og som markerer et skifte fra rene algoritmiske gennembrud til værktøjer, der tjener musikere, undervisere og andre ikke‑tekniske brugere. Kaldet, udsendt af tidsskriftets redaktionsudvalg, påpeger, at selvom nyere arbejde har presset grænserne for lyd‑sprogmodeller – såsom Music Flamingo‑systemet, der kan analysere og generere komplekse musikalske strukturer – forbliver de fleste af disse fremskridt indespærret i laboratorier. Redaktørerne argumenterer for, at den virkelige adoption stopper, fordi udviklere sjældent tager højde for latens, fortolkelighed og arbejdsflow‑begrænsninger, som ikke‑ingeniører møder, når de integrerer AI i øvelser, live‑lyd eller undervisningssituationer. Hvorfor dette er vigtigt nu, er tofoldigt. For det første vokser det AI‑drevne lydmarked hurtigt; estimater antyder, at AI‑forstærkede musikproduktionsværktøjer vil indfange en betydelig andel af det globale DAW‑marked inden for de næste tre år. For det andet lover sammenløbet mellem store sprogsmodeller (LLM’er) og signal‑behandlings‑pipelines “semantisk” kontrol over timbre, arrangement og effekter – men kun hvis disse kontroller kan udtrykkes på almindeligt sprog eller gennem intuitive gestusser. At bygge bro over dette hul kunne demokratisere musikskabelse af høj kvalitet, sænke barriererne for uafhængige kunstnere og åbne nye veje for tilgængelighedsteknologier såsom hørenedsættelses‑augmentation. Det, man skal holde øje med fremover, er den første bølge af artikler, der vil komme ud fra dette emne. Man kan forvente casestudier, der evaluerer LLM‑drevne grænseflader med live‑musikere, benchmarks, der måler real‑time latens på forbruger‑klasse hardware, samt standardforslag til interoperable AI‑plugins. Hvis fællesskabet leverer brugbare prototyper, kan store DAW‑leverandører og streamingplatforme begynde at integrere LLM‑baserede assistenter i deres produkter, og dermed omsætte den nuværende forskningshype til hverdags‑kreative værktøjer. Initiativet bygger på momentum fra den seneste AI‑audio‑forskning – mest bemærkelsesværdigt Music Flamingo‑modellen og den bredere bevægelse mod AI‑forstærket beregnings‑auditivitet – ved eksplicit at invitere arbejde, der besvarer både “hvem” og “hvordan”. Interessenter bør holde øje med kommende konferencessioner og industridemoer, der viser disse bruger‑centrerede prototyper, da de vil indikere, hvor hurtigt kløften mellem banebrydende modeller og daglig musikpraksis lukkes.

Frontiers — https://www.frontiersin.org/research-topics/80293/ubiquitous-musical-signal-proc arxiv.org — https://arxiv.org/abs/2511.10289 www.merl.com — https://www.merl.com/publications/docs/TR2025-116.pdf link.springer.com — https://link.springer.com/content/pdf/10.1186/s13636-024-00353-7.pdf www.emergentmind.com — https://www.emergentmind.com/papers/2409.01864 Mastodon — https://mastodon.social/@theinternetiscrack/116426028439308935

36

3 timer med Claude Opus 4.7: funktionel studie‑webapp og fjern‑MCP – én gang

HN +6 kilder hn

anthropicclaudecohere

Claude Opus 4.7 beviste sin langtidsholdbare autonomi i en tre‑timer live‑test, der leverede en fuldt funktionel studie‑webapp og et fjernbetjent model‑kontrolpanel (MCP) uden menneskeskrevet kode. Udvikleren, der arbejdede ud fra en enkelt prompt, bad Claude om at designe brugergrænsefladen, generere en Flask‑backend, forbinde en PostgreSQL‑database og eksponere et API, som kunne kaldes fra et separat browser‑baseret kontrolpanel. Inden for få minutter leverede modellen et komplet projektskelleton, og efter en kort cyklus af afklarende prompts forfinede den autentificering, tilføjede paginering og deployerede stakken til en gratis Heroku‑instans. Ved sessionens afslutning var webappen live, data kunne indtastes, og den fjernbetjente MCP gjorde det muligt for brugeren at justere modelparametre og se token‑forbrug i realtid. Hvorfor det er vigtigt, er tofoldigt. For det første bekræfter testen de påstande, som Anthropic selv har fremsat i deres udrulningsnoter, om at Opus 4.7 kan håndtere “svære problemer” i flere timer – et spring fra tidligere modeller, der ofte gik i stå efter et par hundrede tokens. For det andet forkorter evnen til at generere end‑to‑end produktionskode itereringsløkken, som hidtil har begrænset AI‑assisteret udvikling til små kode‑uddrag og prototyper. For startups og virksomheder, der allerede lider under talentmangel, kan en model, der selv kan levere deployerbare tjenester, omforme ingeniørbudgetter og accelerere time‑to‑market. Det næste, man bør holde øje med, er Anthropics kommende integration af Opus 4.7 i Vertex AI og AWS Bedrock, hvilket vil gøre modellen tilgængelig i stor skala og potentielt sænke barrieren på $5‑$25 per million tokens. Fællesskabet tester også best‑practice‑skabeloner, der kombinerer detaljerede planer med “høj‑indsats” prompts – en teknik fremhævet i vores tidligere analyse af Opus 4.7’s præstation den 18. april. Opfølgende benchmarks mod Sonnet 4.8 og Mythos 5 vil vise, om Opus’ autonomi omsættes til konsistent kvalitet på tværs af domæner, og om udviklere vil adoptere den som en primær kodningspartner eller beholde den som en niche‑assistent.

HN — https://github.com/AmmarSaleh50/study-dashboard-demo www.youtube.com — https://www.youtube.com/watch?v=OIfRt1oyAss www.anthropic.com — https://www.anthropic.com/news/claude-opus-4-7 claude.com — https://claude.com/resources/tutorials/working-with-claude-opus-4-7 apidog.com — https://apidog.com/blog/claude-opus-4-7-free/ claudefa.st — https://claudefa.st/blog/guide/development/opus-4-7-best-practices

36

Mastodon +6 kilder mastodon

agentschipscopilotmicrosoft

Microsoft har hævet priserne på sin Surface‑serie, med en stigning på 100‑500 USD på de fleste modeller, mens branchen kæmper med en fornyet mangel på RAM. Forhøjelserne, bekræftet af Microsofts egne butikslister og rapporteret af Windows Central, afspejler de stigende omkostninger til DRAM‑ og NAND‑chips, som er blevet presset af efterspørgselsboom i pandemiperioden, flaskehalse i forsyningskæden og en eksplosion i AI‑drevne datacentre. Ved at overføre de højere komponentomkostninger til forbrugerne signalerer Microsoft, at manglen ikke længere er en midlertidig forbigående hændelse, men en strukturel begrænsning, der påvirker premium‑PC‑markedet. Tiltagelsen får ringe efterklang ud over laptop‑segmentet og kaster de tre største producenter af hukommelseschips—SK Hynix, Micron og SanDisk (Western Digitals NAND‑afdeling)—ind i investeringsspotlyset. SK Hynix, verdens næststørste DRAM‑leverandør, drager fordel af sit aggressive kapacitetsudvidelsesprogram i Sydkorea, som sigter mod at tilføje over 300 GB pr. sekund i ny produktion inden 2027. Micron, den eneste amerikanske DRAM‑producent, har hastigt forsøgt at skalere sine 3‑D‑stablede teknologier, men indtjeningen forbliver volatil på grund af svingende efterspørgsel fra både forbruger‑PC’er og virksomheders AI‑arbejdsbelastninger. SanDisk, selvom den primært er en NAND‑spiller, nyder godt af en diversificeret portefølje, der inkluderer solid‑state‑drev til datacenter‑servere – et segment, der vokser, efterhånden som generative AI‑modeller kræver stadig mere lagerplads. Investorer bør holde øje med kvartalsresultaterne for at få ledetråde om, hvordan hver virksomhed balancerer lagerbeholdninger mod den vedvarende chip‑overskud, samt med annonceringer om ny fab‑kapacitet eller joint ventures, der kan tippe den konkurrencemæssige balance. En yderligere prisjustering fra Microsoft eller et skifte mod alternativt silicium som LPDDR5X vil teste efterspørgselselasticiteten og kan omforme indtjeningsudsigterne for de tre producenter. Den kommende indtjeningssæson, planlagt til begyndelsen af Q3, vil sandsynligvis afsløre, hvilken chipproducent der er bedst positioneret til at drage fordel af den fortsatte hukommelsesknaphed.

Mastodon — https://jforo.com/@yayafa/116424012978020604 www.pcmag.com — https://www.pcmag.com/news/microsoft-raises-prices-of-surface-laptops-amid-memor www.tradingkey.com — https://www.tradingkey.com/analysis/stocks/us-stocks/261779769-microsoft-surface www.msn.com — https://www.msn.com/en-us/news/technology/the-memory-shortage-strikes-again-this finance.yahoo.com — https://finance.yahoo.com/sectors/technology/articles/microsoft-raises-surface-p www.windowscentral.com — https://www.windowscentral.com/hardware/surface/microsoft-reveals-major-price-in

32

fly51fly (@fly51fly) på X

Mastodon +6 kilder mastodon

Kinesisk AI‑forsker og BUPT‑professor fly51fly annoncerede en ny tilgang til at udvide store sprogmodellers (LLM‑ers) evne til at håndtere meget lange input. I et opslag på X introducerede han “Shuffle the Context”, en selv‑destillationsteknik, der justerer den populære Rotary Positional Embedding (RoPE) for bedre at bevare information over udvidede token‑vinduer. Ved tilfældigt at permutere segmenter af konteksten under en lærer‑elev‑træningssløjfe tvinger metoden modellen til at lære positions‑agnostiske repræsentationer, samtidig med at rækkefølgen respekteres, så den kan bevare sammenhængen over titusinder af tokens. Gennembruddet er vigtigt, fordi håndtering af lang kontekst fortsat er en central flaskehals for LLM‑er, der anvendes i virkelige applikationer såsom juridisk kontraktanalyse, videnskabelig litteraturgennemgang og fler‑trins dialog. Eksisterende omveje – glidende vinduer, retrieval‑augmented generation eller skalering af opmærksomhed til 100 k‑token‑vinduer – medfører enten store beregningsomkostninger eller går på kompromis med nøjagtigheden. “Shuffle the Context” lover en letvægts‑tilpasning, der kan anvendes på fortrænede modeller uden fuld gen‑træning, og potentielt levere højere præcision på benchmarks som LongBench samt på domænespecifikke opgaver, der kræver dyb ræsonnement over omfattende tekster. Som vi rapporterede den 6. april, har fly51fly været en produktiv stemme på X, hvor han deler fremskridt fra udtryksfulde digitale avatarer til kode‑fokuserede LLM‑er. Dette seneste bidrag tilføjer en ny dimension til hans portefølje og retter sig mod et problem, som den bredere AI‑fællesskab hastigt forsøger at løse. Hvad man skal holde øje med: Det fulde papir forventes at blive lagt på arXiv inden for få dage, ledsaget af en open‑source‑implementation. Tidlige adoptører vil sandsynligvis benchmarke teknikken mod OpenAI’s 128 k‑token GPT‑4 Turbo og Anthropic’s Claude 2.1. Brancheobservatører bør følge, om kinesiske laboratorier som Zhipu AI eller Alibaba integrerer “Shuffle the Context” i deres næste generations modeller, og om metoden kan skaleres til multimodale eller retrieval‑augmented pipelines. Hvis påstandene holder, kan tilgangen blive et standard‑plug‑in til at udvide kontekst‑vinduer uden de prohibitive omkostninger ved at træne endnu større transformer‑modeller.

Mastodon — https://mastodon.sayzard.org/@sayzard/116423426360245531 x.com — https://x.com/fly51fly mobile.twitter.com — https://mobile.twitter.com/fly51fly/status/1633950330948927490 piclur.com — https://piclur.com/profile/fly51fly github.com — https://github.com/fly51fly twitter.com — https://twitter.com/fly51fly/status/1671472603880636418

32

scythe@八方塞がり (@keiyotokei) på X

Mastodon +6 kilder mastodon

gpt-5openai

OpenAI har lanceret GPT‑5.4‑Pro, en ny højtydende stor sprogmodel, der tilbydes til en grundpris på 100 $ pr. måned. Meddelelsen, som blev postet af X‑brugeren @keiyotokei, signalerer virksomhedens bestræbelse på at gøre sine mest kapable modeller økonomisk mere tilgængelige efter en periode med udelukkende premium‑priser for erhvervskunder. Dette skridt er vigtigt, fordi det indsnævrer kløften mellem banebrydende AI og budgetterne hos små virksomheder, forskningslaboratorier og endda avancerede hobbyister. Indtil nu har de mest kraftfulde versioner af OpenAIs modeller – såsom GPT‑4 Turbo – i praksis været låst bag forbrugsbaserede API‑gebyrer eller dyre erhvervs‑kontrakter. Et fladt prisniveau på 100 $ bringer en “pro‑

Mastodon — https://mastodon.sayzard.org/@sayzard/116422981340364339 mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1275651441080795138 mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1382016076171472899 x.com — https://x.com/team_happofusa x.com — https://x.com/hashtag/八方塞がり mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1381869384646291459

32

Mastodon +6 kilder mastodon

Et viralt opslag på X i denne uge udløste en ny bølge af debat om, hvordan teknologibranchen forsøger at “tæmme” store sprogmodeller (LLM’er). Beskeden, som AI‑kommentatoren Mikael Sundberg postede, sammenlignede moderne forsøg på LLM‑styring med en Warhammer 40 K Tech‑præst, der synger til Machine Spirit: “People trying to control LLMs are just W40K Tech‑Priests praying to the Machine Spirit. Send toot.” Den spidsfindige analogi samlede hurtigt tusindvis af likes, retweets og en strøm af kommentarer fra forskere, etikere og hobbyister. Sundbergs sammenligning rammer en langvarig kulturel spænding. På den ene side ruller virksomheder og reguleringsmyndigheder guardrails ud – API‑er til filtrering af prompts, audits af brugspolitikker og nye bestemmelser i “AI‑acten” – med det formål at holde generativ AI i overensstemmelse med samfundets normer. På den anden side argumenterer udviklere for, at sådanne foranstaltninger ofte ligner ritualistisk overtro mere end ingeniørkunst, en holdning der også høres i Warhammer‑lore, hvor Adeptus Mechanicus mener, at hver fejl er en utilfreds Machine Spirit, der skal beroliges gennem ceremoni. Hvorfor metaforen er vigtig, er todelt. For det første tydeliggør den en voksende frustration over, at top‑down‑kontroller kan kvæle innovation uden at løse de underliggende tekniske udfordringer med alignment og fortolkelighed. For det andet omformer den meme‑drevne ramme den offentlige diskurs, så en teknisk politikdebat bliver til en kulturel fortælling, der resonnerer med et bredere, ikke‑teknisk publikum. Ved at påkalde et elsket sci‑fi‑univers sænker opslaget barrieren for lægfolk, så de kan engagere sig i komplekse AI‑sikkerhedsspørgsmål. Det, man skal holde øje med fremover, er bølgerne i politiske kredse og i branchens roadmap‑planer. EU‑Kommissionens høring om AI‑acten, som forfalder senere på måneden, kan komme til at referere til “ritual vs. rigor”‑argumentet, efterhånden som interessenter presser på for klarere, standardbaseret compliance i stedet for ad‑hoc‑sikringer. Samtidig har store LLM‑udbydere annonceret interne “responsibility labs”, der sigter mod at gå ud over overfladiske filtre og mod model‑niveau fortolkelighed – et direkte svar på kritikken om, at de nuværende kontroller kun er symbolske. Diskussionen, som Sundbergs tweet har sat i gang, vil sandsynligvis påvirke, hvordan regulatorer, virksomheder og offentligheden konceptualiserer balancen mellem frihed og sikkerhed i den næste generation af generativ AI.

Mastodon — https://mastodon.zergy.net/@Enalys/116426597057162048 www.reddit.com — https://www.reddit.com/r/40kLore/comments/1bvnce6/machine_spirits_what_are_they_ steamcommunity.com — https://steamcommunity.com/app/2186680/discussions/0/4298195009695311211/?ctp=2 warhammer40k.fandom.com — https://warhammer40k.fandom.com/wiki/Machine_Spirit wh40k.lexicanum.com — https://wh40k.lexicanum.com/wiki/Machine_spirit www.reddit.com — https://www.reddit.com/r/40kLore/comments/100ibe5/so_in_40k_praying_to_machines_

26

De førende modeller er nu “næsten uadskillelige” fra hinanden, når det gælder ydeevne, ifølge

Mastodon +6 kilder mastodon

En ny rapport fra Stanford Institute for Human‑Centered Artificial Intelligence (HAI) viser, at præstationskløften mellem verdens førende sprogmodeller i praksis er forsvundet. På tværs af en række benchmark‑opgaver scorer OpenAI’s GPT‑4‑Turbo, Anthropic’s Claude 3, Googles Gemini 1.5 samt en række open‑weight‑modeller som Llama 3 og Mistral‑7B kun få procentpoint fra hinanden. Undersøgelsen beskriver fænomenet som “næsten uadskillelig”, og bemærker, at open‑weight‑modeller nu er “mere konkurrencedygtige end nogensinde” og konvergerer mod den samme kapacitetsgrænse. Denne konvergens er vigtig, fordi den vender den traditionelle kapløb‑dynamik på hovedet, som hidtil har været drevet af rå kapacitet. Når rå scores ikke længere adskiller leverandørerne, flytter det konkurrencetrykket sig mod sekundære egenskaber: inferensomkostninger, latenstid, fleksibilitet i fin‑tuning, sikkerhedsværktøjer og økosystem‑binding. For virksomheder betyder det et bredere udvalg af muligheder og muligheden for at erstatte en proprietær API med et open‑weight‑alternativ uden at gå på kompromis med ydeevnen. For branchen vil kapløbet sandsynligvis intensiveres omkring beregningseffektivitet, prismodeller og certificeringer for ansvarlig AI i stedet for overskrifts‑fængende kapacitetsopgraderinger. Som vi rapporterede den 17. april, indikerede vores reproduktion af Anthropic’s Mythos‑resultater med offentlige modeller allerede en indsnævring af kløften; Stanford‑rapporten bekræfter, at tendensen nu er systemisk. De kommende måneder vil vise, hvordan virksomheder reagerer. Hold øje med lanceringen af næste‑generations open‑weight‑udgivelser, prisjusteringer fra cloud‑udbydere og nye benchmark‑sæt som HELM 2.0, der har til formål at indfange omkostningseffektivitet og sikkerheds‑metrikker. Reguleringsorganer forventes også at fokusere på gennemsigtighed og alignment‑standarder, og gøre disse kriterier til nye konkurrencemæssige løftestænger i et marked, hvor rå præstation ikke længere er differentieringsfaktoren.

Mastodon — https://tldr.nettime.org/@remixtures/116422664607009746 arxiv.org — https://arxiv.org/html/2510.01731v2 arxiv.org — https://arxiv.org/html/2509.14223v1 news.ycombinator.com — https://news.ycombinator.com/item?id=43856172 studyfinds.org — https://studyfinds.org/the-ai-scam-that-could-threaten-public-opinion-research/ cybernative.ai — https://cybernative.ai/t/distinguishing-genuine-self-modeling-from-stochastic-dr

26

Wei Ping (@_weiping) på X

Mastodon +6 kilder mastodon

deepseek

Kinesisk AI‑laboratorium Zhipu AI har offentliggjort en teknisk rapport om sin seneste store sprogmodel, GLM‑5, og dokumentet bliver allerede hyldet som den mest imponerende analyse siden DeepSeek‑V3/R1. Rapporten, som blev fremhævet af NVIDIA’s fremtrædende forskningsforsker Wei Ping på X, beskriver en række opmærksomhedseffektivitet‑innovationer — herunder en hybrid variant af effektiv opmærksomhed, sparsomme opmærksomhedsmønstre og en glidende‑vindue‑mekanisme — understøttet af omfattende ablationsstudier og præstationsbenchmark‑data. Betydningen ligger i modellens evne til at levere sammenlignelig eller overlegen perplexitet i forhold til samtidige modeller, samtidig med at den reducerer hukommelses‑ og beregningsforbruget med op til 40 procent. Sådanne gevinster tackler de stigende omkostninger ved træning og betjening af modeller med flere milliarder parametre, et flaskehalsproblem der har bremset bredere udrulning uden for velfinansierede cloud‑udbydere. Ved at offentliggøre detaljerede eksperimentelle data giver GLM‑5‑teamet forskningssamfundet reproducerbare indsigter, som kan fremskynde adoptionen af sparsomme og lokalitets‑bevidste opmærksomhedsmekanismer i hele LLM‑økosystemet. Wei Pings godkendelse vejer tungt: hans arbejde hos NVIDIA fokuserer på hardware‑bevidst modeldesign, og hans offentlige ros signalerer, at GLM‑5‑teknikkerne er kompatible med virksomhedens kommende H100‑kompatible software‑stack. Hvis resultaterne omsættes til open‑source‑kode eller integreres med NVIDIAs TensorRT‑LLM, kan udviklere opleve umiddelbare præstationsforbedringer på eksisterende infrastruktur. Det, der skal holdes øje med fremover, omfatter den formelle udgivelse af GLM‑5‑vægtfilerne, forventede benchmark‑resultater på HELM‑ og MMLU‑suiterne samt eventuelle partnerskabsmeddelelser mellem Zhipu AI og hardware‑leverandører. Lige så vigtigt vil være opfølgende artikler, der undersøger skalering af de rapporterede opmærksomhedsvarianter til trillion‑parameter‑regimer, et skridt der potentielt kan omforme det konkurrencemæssige landskab mellem kinesiske og vestlige LLM‑udviklere.

Mastodon — https://mastodon.sayzard.org/@sayzard/116415417977650089 www.youtube.com — https://www.youtube.com/channel/UCQMZ8SB9-tX8gzXRPR5LBuw www.tiktok.com — https://www.tiktok.com/@weiping1 www.linkedin.com — https://www.linkedin.com/pub/dir/Weiping/+ aguea.net — https://aguea.net/_weiping users.encs.concordia.ca — https://users.encs.concordia.ca/~weiping/

26

Tinder og Zoom tilbyder “bevis på menneskelighed” øjenskanninger for at bekæmpe AI

Mastodon +6 kilder mastodon

Tinder og Zoom har annonceret, at de vil indlejre øjenskanningsteknologi i deres platforme som et “bevis på menneskelighed”-tiltag, der skal begrænse AI‑genereret efterligning og bot‑aktivitet. Funktionen, som er planlagt til en begrænset beta senere i dette kvartal, indfanger en hurtig scanning af netværkets mønster gennem enhedens kamera og sammenligner den med en sikker, on‑device skabelon for at bekræfte, at brugeren er en levende person, inden der gives adgang til videoopkald eller profilinteraktioner. Initiativet kommer som følge af en bølge af deep‑fake‑ og syntetisk‑stemmeangreb, der har undermineret tilliden til realtidskommunikationsværktøjer. Zoom, som indgik et partnerskab med Worldcoin om biometrisk verifikation i en historie, vi dækkede den 18. april, udvider nu denne tilgang til en bredere forbrugerbase. Tinder, der kæmper med automatiserede swipe‑farme, som oppuster match‑statistikker, ser øjenskanningen som en måde at beskytte ægte brugerengagement og reducere svindelrelaterede udelukkelser. Ud over den umiddelbare sikkerhedsfordel rejser udrulningen betydelige privatlivsspørgsmål. Biometriske data såsom netværksmønstre

Mastodon — https://sunny.garden/@greenpete/116421397336510610 mashable.com — https://mashable.com/live/ces-2026-news-live-blog-updates stareintothelightsmypretties.jore.cc — https://stareintothelightsmypretties.jore.cc/tag/analytics/ www.freelancer.com.bd — https://www.freelancer.com.bd/jobs/mobile-app-development/4 www.freelancer.com — https://www.freelancer.com/job-search/freelance-microsoft-azure/ stareintothelightsmypretties.jore.cc — https://stareintothelightsmypretties.jore.cc/tag/robots/

24

Shapley‑værdi‑styret adaptiv ensemble‑læring for forklarlig finansiel svindelopdagelse med validering af amerikansk regulatorisk overholdelse

ArXiv +5 kilder arxiv

Et forskerteam ledet af Mohammad Nasir Uddin har offentliggjort en ny arXiv‑preprint, *Shapley‑værdi‑styret adaptiv ensemble‑læring for forklarlig finansiel svindelopdagelse med validering af amerikansk regulatorisk overholdelse* (arXiv:2604.14231v1). Artiklen foreslår et adaptivt ensemble, der dynamisk udvælger de mest forudsigende grundlæggere for hver transaktion, og kombinerer dem med et SHAP‑baseret attribution‑lag, som leverer forklaringer på post‑niveau. Ved brug af PaySim‑simulatorens datasæt på 6,36 millioner transaktioner rapporterer forfatterne en stigning på 4,2 procentpoint i AUC i forhold til en standard gradient‑boosted baseline, samtidig med at de leverer forklaringer, der opfylder Office of the Comptroller of the Currency’s (OCC) audit‑kriterier. Arbejdet er vigtigt, fordi finansiel kriminalitet nu tærer på mere end 32 milliarder dollars årligt fra amerikanske institutioner, og regulatorerne strammer grebet om uigennemsigtig AI. Som vi rapporterede den 18. april, kræver OCC og andre myndigheder transparente, auditérbare modeller til risikomonitorering i banksektoren. Ved at indlejre Shapley‑værdier direkte i beslutningsprocessen lover den nye metode både den forudsigelseskraft, som moderne ensembles besidder, og den sporbarhed, der kræves for overholdelse, hvilket potentielt kan åbne døren for bredere AI‑adoption i svindelforebyggelses‑stakke, der hidtil har været afhængige af ældre regelbaserede systemer. Det næste at holde øje med er tre konvergerende udviklinger. For det første har forfatterne indsendt manuskriptet til *IEEE Transactions on Knowledge and Data Engineering*, så fagfællebedømmelsesresultaterne vil signalere akademisk validering. For det andet har flere amerikanske banker udtrykt interesse for at pilot‑teste rammeværket under OCC’s kommende AI/ML‑vejledning, et skridt der kan levere de første real‑world‑resultater ud over syntetiske simulationer. Endelig begynder branche‑standardiseringsorganer som Financial Industry Regulatory Authority (FINRA) at udarbejde metrikker for XAI‑overholdelse; hvordan det Shapley‑styrede ensemble stemmer overens med disse metrikker, vil afgøre, om det bliver en de‑facto benchmark for forklarlig svindelopdagelse.

ArXiv — https://arxiv.org/abs/2604.14231 www.sciencedirect.com — https://www.sciencedirect.com/science/article/pii/S1544612323006815 journals.sagepub.com — https://journals.sagepub.com/doi/10.1177/18724981241289751 www.researchgate.net — https://www.researchgate.net/publication/390235753_Explainable_AI_XAI_for_Fraud_ lrc.perdanauniversity.edu.my — https://lrc.perdanauniversity.edu.my/sdi/shapley-value-guided-adaptive-ensemble-

24

Gmail‑etiketbro på Claude Cowork er netop brudt sammen

HN +6 kilder hn

claudegooglegpt-5reasoning

Claude Cowork’s Gmail‑label bridge har gået offline, hvilket efterlader tusindvis af brugere ude af stand til at synkronisere e‑mail‑etiketter med det AI‑drevne arbejdsområde. Fejlen dukkede op tidligt tirsdag, da integrationen, som automatisk spejler Gmail‑etiketter som projekt‑tags i Claude‑Cowork, begyndte at returnere 502‑fejl. Anthropic bekræftede nedbruddet på sin status‑side og tilskrev det en nylig ændring i Googles Gmail‑API, som ødelagde den autentificerings‑flow, broen benytter. Problemet er væsentligt, fordi broen er en hjørnesten i Claude Coworks løfte om at omdanne almindelige indbakker til samarbejdende vidensbaser. Ved at trække etiketdata ind i Claudes kontekstvindue kan systemet fremvise relevante tråde, foreslå næste‑trin‑handlinger og fodre modellen med opdateret information uden manuel kopiering og indsættelse. Virksomheder, der har bygget interne arbejdsgange omkring denne automatisering, står nu over for stoppede sags‑routing, forsinkede godkendelser og et pludseligt behov for at vende tilbage til manuelle processer. Med Googles brugerbase på 2 milliarder har selv en niche‑fejl bølger gennem det bredere AI‑produktivitet‑marked, hvilket understreger, hvor tæt moderne arbejdsredskaber er afhængige af stabile tredjeparts‑API’er. Anthropic har lovet en hotfix inden for 48 timer og ruller en fallback‑OAuth‑token‑mekanisme ud for at beskytte mod fremtidige API‑ændringer. Observatører vil holde øje med, hvor hurtigt rettelsen genopretter fuld etiket‑synkronisering, og om Google vil stramme deres politik for meddelelse om API‑ændringer – et skridt, der kunne tvinge andre AI‑platforme til at redesigne lignende forbindelser. Episoden genopliver også debatten, der blev udløst af vores tidligere dækning af Anthropics Claude Opus‑ og Claude Code‑udgivelser, og fremhæver afvejningen mellem kraftfulde, kontekst‑rige modeller og skrøbeligheden i den lim, der binder dem til hverdagssoftware. De kommende dage vil vise, om Claude Cowork kan genvinde tilliden, eller om brugerne vil migrere til mere robuste, selv‑hostede alternativer.

HN — https://news.ycombinator.com/item?id=47811466 threadreaderapp.com — https://threadreaderapp.com/user/JafarNajafov zenvanriel.com — https://zenvanriel.com/ai-engineer-blog/ hackernewsday.com — https://hackernewsday.com/ www.classicfilmtvcafe.com — https://www.classicfilmtvcafe.com/2009/10/31-days-of-halloween-one-good-thing.ht www.workerscompensation.com — https://www.workerscompensation.com/additional-education-materials/45270/

Alle datoer