AI News

547

Anthropics Claude Mythos‑lansering er bygget på feilinformasjon

Anthropics Claude Mythos‑lansering er bygget på feilinformasjon
Lobsters +8 kilder lobsters
anthropicclaude
Anthropics mye omtalte Claude Mythos-modell har blitt kritisert etter at en koalisjon av AI‑forskere og journalister publiserte en felles etterforskning som hevder at selskapets lanseringsfortelling hviler på en rekke misvisende påstander. Rapporten, som ble publisert på tirsdag, peker på interne e‑poster, benchmark‑data og demovideoer som, ifølge etterforskerne, overdriver Mythos’ ytelse, bagatelliserer kjente sikkerhetsgap og feilrepresenterer omstendighetene rundt en «sandbox‑flukt» som firmaet tidligere offentliggjorde. Som vi rapporterte 18. april, møtte Anthropics administrerende direktør White House sin stabssjef for å diskutere amerikansk tilgang til Mythos, et møte som signaliserte modellens strategiske betydning for nasjonal sikkerhet. De nye påstandene antyder imidlertid
404

Anthropic har nettopp gitt Claude et designstudio. Slik fungerer Claude Design egentlig.

Anthropic har nettopp gitt Claude et designstudio. Slik fungerer Claude Design egentlig.
Dev.to +7 kilder dev.to
anthropicclaudefine-tuning
Anthropic lanserte Claude Design Studio tirsdag, og stiller sin flaggskip‑LLM som en direkte konkurrent til Figmas designøkosystem. Det nye nettbaserte studioet lar brukere beskrive et UI‑konsept i naturlig språk og får en fullverdig mock‑up med vektor‑elementer, layout‑forslag og merkevare‑konsekvente fargepaletter. Brukerne kan deretter iterere ved å be Claude om å justere avstand, bytte ikoner eller generere alternativ typografi, alt i ett grensesnitt som kan eksportere til standard design‑filer (Figma, Sketch, Adobe XD). Lanseringen følger Anthropics nylige utrulling av Claude Opus 4.7 og den tidligere “Claude Design”-mock‑upen vi rapporterte om 18. april 2026, som antydet en markedsførings‑fokusert prototype. Det er to grunner til at dette er viktig. For det første bringer det generativ AI fra kode‑sentrerte assistenter som Claude Code inn i den visuelle design‑arbeidsflyten, noe som potensielt kan kutte tiden designere bruker på lavnivå‑iterasjon og gjøre det mulig for mindre team å lage høy‑oppløselige prototyper uten en dedikert UI‑spesialist. For det andre, ved å integrere modellen i et eget studio i stedet for som en plug‑in, omgår Anthropic “AI‑som‑tillegg”-modellen som har dominert markedet og utfordrer Figmas påstand om å være det eneste knutepunktet for samarbeidende design. Hvis Claude Design kan levere pålitelige, merke
394

Kevin Weil og Bill Peebles forlater OpenAI mens selskapet fortsetter å kutte sideprosjekter

HN +8 kilder hn
openaisora
Kevin Weil, lederen for OpenAIs vitenskapelige forskningsprogram, og Bill Peebles, skaperen av AI‑videoverktøyet Sora, kunngjorde på fredag at de forlater selskapet. Avgangene skjer mens OpenAI kutter «sideprosjekter» og satser kraftig på en bedriftsorientert AI‑strategi forankret i en kommende «superapp». Weil hadde hatt ansvar for OpenAIs satsing på vitenskapelig oppdagelse, senest den begrensede GPT‑Rosalind‑modellen for livsvitenskapelig forskning. Peebles ledet Sora‑teamet, som ble lagt ned i forrige måned etter at OpenAI pekte på forbudende beregningskostnader og et skifte bort fra eksperimentell mediegenerering. Begge avgangene følger en bølge av seniorutskiftninger som startet tidligere denne måneden da chief research officer Mira Murati trakk seg av helsemessige årsaker, og selskapet kunngjorde en omfattende omorganisering av sin ledergruppe. Tiltakene er viktige fordi de signaliserer et tydelig vendepunkt fra høy‑risiko‑ og høy‑kostnadsprosjekter til produkter som raskt kan kommersialiseres i bedriftsmarkedet. Ved å samle talent rundt anvendt AI håper OpenAI å fremskynde
312

"Liberationsdag" hos OpenAI ettersom flere seniorledere kunngjør at de slutter

"Liberationsdag" hos OpenAI ettersom flere seniorledere kunngjør at de slutter
HN +6 kilder hn
openai
OpenAI kunngjorde på torsdag at en bølge av seniorledere vil forlate selskapet, en utvikling som selskapets egen kommunikasjon kalte «Liberationsdag». Avgangene inkluderer lederen for Sora‑videogenereringsteamet, sjefen for forskningsenheten Force Codex, og to senior produktledere som har hatt ansvar for utrullingen av o1‑resonneringsmodellen. Avgangene ble bekreftet i et kort internt notat og senere gjentatt i et kortfattet X‑innlegg fra OpenAIs offisielle konto. Turnoveren markerer den siste i en rekke høyprofilerte avganger som har rystet organisasjonen de siste ukene. Som vi rapporterte 18. april, forlot den tidligere Sora‑sjefen selskapet (se «OpenAIs tidligere Sora‑sjef slutter»), og samme dag så avgangene til Kevin Weil og Bill Peebles, som en del av en bredere «nedskjæring av sideoppdrag». Den nye runden med oppsigelser forsterker bekymringene om at intern strid og uenigheter om o1‑systemets beredskap hemmer OpenAIs evne til å holde seg foran konkurrenter som Anthropic og Google DeepMind.
268

En arkitektur som kombinerer konvolusjonelt nevralt nettverk (CNN) og støttevektormaskin (SVM) for bildeklassifisering

Dev.to +7 kilder dev.to
vector-db
Et team av forskere fra Indian Institute of Technology har avdekket en hybridmodell som kombinerer et konvolusjonelt nevralt nettverk (CNN) med en støttevektormaskin (SVM) for å øke nøyaktigheten i bildeklassifisering. Studien, som ble lagt ut på arXiv denne uken, erstatter det konvensjonelle softmax‑laget på slutten av et CNN med en SVM‑klassifikator, og finjusterer deretter den kombinerte arkitekturen på benchmark‑datasett som CIFAR‑10, en ImageNet‑undergruppe og en medisinsk samling av neglesykdommer. Rapporterte gevinster varierer fra 1,8 prosentpoeng på CIFAR‑10 til imponerende 5,2 poeng på neglesykdomssettet, hvor data er knappe og klasseubalanse er alvorlig. Betydningen ligger i å adressere to langvarige utfordringer med dype visjonsmodeller. For det første kan softmax‑lag overtilpasse når treningsdata er begrenset; SVM‑er, med sitt margin‑maksimerende mål, er mer robuste i små‑prøve‑regimer. For det andre bevarer den hybride tilnærmingen den automatiske funksjonsutvinningen fra CNN‑er samtidig som den utnytter de velkjente generaliseringsegenskapene til kjernebaserte klassifikatorer. Tidlige brukere innen medisinsk bildediagnostikk og industriell inspeksjon har allerede rapportert raskere konvergens og lavere falske‑positiv‑rater, noe som tyder på at metoden kan redusere det beregningsmessige budsjettet for AI på kanten. Forfatterne planlegger å utvide rammeverket til fler‑etikett‑oppgaver og å utforske alternative kjerner som kan læres ende‑til‑ende. Industrifolk vil følge med på integrering i populære dyp‑læringsbiblioteker som PyTorch og TensorFlow, noe som kan akselerere adopsjonen i produksjons‑pipelines. En kommende benchmark på CVPR 2026‑workshopen vil sette CNN‑SVM‑kombinasjonen opp mot rene transformer‑baserte visjonsmodeller, og gi et tydelig signal på om hybridmodellen kan holde mål når feltet beveger seg mot stadig større, data‑tørste arkitekturer.
240

Caffeine.ai vs Replit: Hvorfor jeg byttet Vibe‑koding til Internet Computer https://www. madeby

Caffeine.ai vs Replit: Hvorfor jeg byttet Vibe‑koding til Internet Computer https://www.  madeby
Mastodon +7 kilder mastodon
agents
Et utvikler‑rettet blogginnlegg publisert på MadebyAgents denne uken beskriver en praktisk migrasjon fra Replit sin “vibe‑coding”-pakke til Caffeine.ai, og til slutt til Internet Computer (ICP)‑blockchainen. Forfatteren, som testet seks AI‑drevne kodeplattformer, fant Replit sin grensesnitt for naturlig språk intuitivt, men begrenset av ugjennomsiktig prisstruktur, få distribusjonsalternativer og en stadig voksende kø for beregningsressurser. Caffeine.ai, en nyere aktør som lover tettere integrasjon med store språkmodeller og raskere iterasjons‑sykluser, virket i første omgang som en løsning på disse problemene, men den proprietære skyen påla fortsatt leverandørlås og bekymringer rundt dataprivatliv. Den avgjørende faktoren, ifølge skribenten, var ICPs desentraliserte arkitektur. Ved å kompilere den genererte koden til canisters — selvstendige smarte kontrakter — kan utviklere lansere fullt funksjonelle web‑apper uten en tradisjonell skyleverandør, og dra nytte av nesten null vertskostnader, on‑chain‑styring og innebygde token‑insentiver for ressursbruk. Innlegget påpeker at ICP‑økosystemet nå tilbyr ferdige SDK‑er for populære LLM‑bakender, slik at “vibe‑coding”-spørringer kan kjøres direkte på nettverket mens brukerens data forblir under egen kontroll. Hvorfor skiftet er viktig av to grunner. For det første signaliserer det en modning av AI‑assistert utviklingsverktøy fra sandkasse‑SaaS‑miljøer mot åpne, programmerbare infrastrukturer som er i tråd med den bredere Web3‑bevegelsen. For det andre er kostnadsforskjellen markant: ICP kan hoste en typisk Replit‑lignende app for en brøkdel av en cent per måned, et overbevisende tilbud for indie‑utviklere og oppstartsbedrifter med stramme budsjetter. Fremover vil fellesskapet følge med på hvordan ICPs kommende “Canister‑AI”‑runtime, planlagt for Q3 2026, forenkler modellhosting, og om andre AI‑kodeplattformer adopterer lignende desentraliserte distribusjonsmodeller. Like kritisk vil utviklingen av standarder for prompt‑sikkerhet og provenance være, ettersom mer kode genereres og kjøres på offentlige blockchains. Resultatet kan omforme økonomien i AI‑forsterket programvareutvikling i den nordiske teknologiscenen og videre.
193

# Technology    # DataAnalytics    # Data   Hvordan få Claude Code til å forbedre seg fra sine egne feil

# Technology    # DataAnalytics    # Data   Hvordan få Claude Code til å forbedre seg fra sine egne feil
Mastodon +10 kilder mastodon
claude
Anthropics Claude Code har tatt et skritt mot selv‑læring, som beskrevet i en ny veiledning på Towards Data Science med tittelen «How to Make Claude Code Improve from its Own Mistakes». Guiden leder dataforskere gjennom en gjenta‑spør‑forbedre‑sløyfe som lar Claude Code flagge, forklare og automatisk omskrive feilaktige kodebiter uten menneskelig inngripen. Ved å fange opp feilmeldinger, mate dem tilbake inn i modellen, og utnytte Claudes innebygde analyseverktøy for sanntids‑kodekjøring, kan brukere forvandle ett mislykket kjøringsforsøk til en kjede av inkrementelle forbedringer. Utviklingen er viktig fordi Claude Code allerede er posisjonert som en lav‑kode‑partner for analytikere som foretrekker konversasjonsbaserte arbeidsflyter fremfor tradisjonelle IDE‑er. Som vi rapporterte 17. april, lanserte Anthropic Claude Code‑arbeidsflyten sammen med Opus 4.7‑oppgraderingen, med løfte om tettere integrasjon med regneark, PDF‑filer og API‑pipelines. Det nye selv‑korrigeringsmønsteret reduserer friksjonen ved «debug‑then‑prompt», som har begrenset bredere adopsjon, særlig i miljøer som håndterer store, ustrukturerte datasett. Tidlige brukere hevder opptil 30 prosent mindre manuell omskrivningstid når de behandler tabeller med en halv million rader, en gevinst som kan endre hvordan mellomstore bedrifter bemanner data‑analyseprosjekter. Fremover forventes Anthropic å bygge inn tilbakemeldingssløyfen direkte i Claude‑AI‑konsollen, og gjøre ad‑hoc‑prompting til en vedvarende læringssyklus. Observatører vil følge med på den kommende funksjonen «Claude Code Auto‑Refine» som er planlagt på Q3‑veikartet, samt eventuelle open‑source‑utvidelser som lar team eksportere korrigeringshistorikken for fin‑tuning. Dersom arbeidsflyten for selv‑forbedring skalerer, kan Claude Code bli den første konversasjonelle koderen som pålitelig lærer av sine egne feil, og stramme inn sløyfen mellom menneskelig intensjon og maskinell utførelse i hele det nordiske AI‑økosystemet.
150

**Bygge Tilstandsfulle AI‑agenter med Backboard: En Fullstendig Funksjonsdykk**

**Bygge Tilstandsfulle AI‑agenter med Backboard: En Fullstendig Funksjonsdykk**
Dev.to +6 kilder dev.to
agentsautonomousvector-db
Backboard, det nye åpne kildekode‑rammeverket som ble kunngjort denne uken, lover å gjøre byggingen av tilstandsfulle AI‑agenter like enkelt som å koble sammen noen få Python‑moduler. Plattformen samler en administrert vektor‑lagring (Supermemory.ai), en “Runner”‑orkestrator som sporer økter, verktøydrevne agenter, og et React‑basert “assistant‑ui”‑grensesnitt, samtidig som den tilbyr native‑hooker for LangGraph og LangChain. Lanseringen inkluderer en delt‑skjerm‑Streamlit‑demo som lar utviklere sammenligne en tilstandsløs chatbot med en Backboard‑drevet agent som beholder kontekst over flere turer, kaller eksterne API‑er og oppdaterer sin egen kunnskapsbase i sanntid. Dette er viktig fordi AI‑markedet er i ferd med å gå fra enkelt‑shot språkmodeller til autonome systemer som kan planlegge, utføre og lære gjennom lengre interaksjoner. Tilstandspersistens reduserer token‑sløsing, forbedrer pålitelighet i e‑handels risikostyring og andre compliance‑tunge domener, og åpner døren for “second‑brain”‑applikasjoner hvor agentens minne utvikler seg sammen med brukeren. Backboards tette integrasjon med Supermemory‑s vektordatabasen betyr at utviklere ikke lenger trenger å sette sammen separate lagringslag, mens Runner‑komponenten håndhever sandkasse‑kjøring – et problem vi påpekte i vår rapport fra 17. april om OpenAIs nye sandbox‑SDK. Fremover vil fellesskapet følge nøye med på hvor raskt Backboard tas i bruk i det voksende LangGraph‑økosystemet, og om den sky‑hostede tjenesten kan holde tritt med nye referanse‑tester som RiskWebWorld. Den neste bølgen av oppdateringer forventes å inkludere multi‑agent‑koordinasjons‑primitiver og dypere menneske‑i‑sløyfen‑kontroller, noe som kan sementere Backboards rolle som de‑facto‑verktøykasse for å bygge produksjonsklare, tilstandsfulle AI‑assistenter. Når bedrifter eksperimenterer med autonome agenter, vil plattformens evne til å skalere minne på en sikker måte bli en avgjørende faktor.
148

Anthropic‑administrerende direktør møtte White House sin stabssjef mens USA søker tilgang til Mythos‑modellen

Mastodon +8 kilder mastodon
anthropic
Anthropic‑administrerende direktør Dario Amodei møtte White House‑stabssjef Susie Wiles, finansminister Scott Bessent og seniorembetsmenn på fredag for å diskutere selskapets nyeste store språkmodell, Mythos. Samlingen i West Wing, som deltakerne beskrev som «produktiv», var den første høytstående dialogen mellom administrasjonen og AI‑firmaet siden Anthropic kunngjorde at de ville pause en bredere utrulling av Mythos inntil de kunne garantere modellens sikkerhet og motstandskraft mot misbruk. Møtet er viktig fordi Mythos anses bredt som et av de mest kapable generative‑AI‑systemene på markedet, og konkurrerer med tilbud fra Meta, Google og OpenAI. Amerikanske tjenestemenn er ivrige etter å sikre tilgang for nasjonale sikkerhetsapplikasjoner, regulatorisk testing og for å vurdere om modellen oppfyller nye sikkerhetsstandarder. Anthropic sliter samtidig med begrenset beregningskapasitet og nylige infrastruktur‑nedbrudd som har bremset deres utrullingsplan. Ved å gå direkte til Det hvite hus signaliserer selskapet vilje til samarbeid om sikkerhetsrevisjoner, samtidig som de motsetter seg for tidlig press om å åpne modellen. Det som nå er å følge med på, er om dialogen fører til en formell avtale om datadeling‑protokoller, rammeverk for sikkerhetsverifisering eller en lisensieringsordning som kan sette en presedens for offentlig‑privat AI‑samarbeid. Kongresskomiteer forventes å innkalle Anthropic og andre AI‑ledere til høringer om modell‑gjennomsiktighet og eksportkontroller, og administrasjonen kan snart utstede veiledning om «pålitelig tilgang» for høy‑risiko‑systemer – et tema som også ble fremhevet i deres nylige cybersikkerhetslansering. Resultatet kan påvirke tidspunktet for en bredere lansering av Mythos, endre konkurransedynamikken i AI‑kappløpet, og definere rammene for USAs politikk på grenseløse modeller.
142

Hva er Mythos og hvorfor er eksperter bekymret for Anthropics AI-modell

Hva er Mythos og hvorfor er eksperter bekymret for Anthropics AI-modell
Mastodon +8 kilder mastodon
anthropic
Anthropics nyeste store språkmodell, Claude Mythos, er trukket tilbake fra offentlig utrulling etter interne tester som avdekket en enestående evne til å lokalisere og utnytte programvare‑sårbarheter på tvers av store operativsystemer. Selskapet opplyste at modellen kan generere funksjonell exploit‑kode, kartlegge privilegierings‑veier og til og med lage phishing‑payloads med minimal menneskelig veiledning. Innen timer etter kunngjøringen samlet finansministere, sentralbanker og seniorbankfolk nødmøter og advarte om at verktøyet kan gi ondsinnede aktører en «superhuman» fordel i cyber‑angrep mot kritisk finansiell infrastruktur. Avsløringen har utløst en bølge av regulatorisk press. Chief information security officers og leverandører av cybersikkerhetsløsninger, som står til å tjene på økt etterspørsel etter defensive produkter, oppfordrer offentlig til rask handling – en motivasjon analytikere mener reflekterer institusjonell selvbevaring like mye som reell risikovurdering. Europeiske og amerikanske myndigheter utarbeider allerede nødbestemmelser under AI‑loven og den amerikanske executive order om AI‑drevede trusler, mens flere nasjonale sikkerhetsbyråer har satt Anthropic på en overvåkningsliste. Hvorfor dette er viktig går utover ett enkelt produkt. Mythos demonstrerer at generativ AI kan gå fra språkoppgaver til autonom oppdagelse av sårbarheter, og forkorte tidsforsinkelsen mellom forskning og våpenisering som tradisjonelt har beskyttet forsvarerne. Dersom slike evner blir bredt tilgjengelige, kan kostnadene ved å sikre operativsystemer, bankplattformer og offentlige nettverk skyte i været, noe som vil omforme cybersikkerhetsmarkedet og tvinge til en revurdering av rammeverk for AI‑styring. Hva man bør følge med på videre: Europakommisjonens kommende AI‑risikoklassifisering for «dual‑use»‑modeller, potensiell rettssak fra selskaper som hevder eksponering, Anthropics plan om å slippe en forsterket, «sandboxed» versjon, samt om rivaliserende laboratorier vil starte et kappløp om å innlemme lignende exploit‑genereringsmoduler i sine egne tilbud. De kommende ukene vil vise om Mythos utløser en regulatorisk omveltning eller blir en katalysator for et nytt defensivt AI‑våpenkappløp.
124

Forstå Transformers del 9: Stabletting av selv‑oppmerksomhetslag

Forstå Transformers del 9: Stabletting av selv‑oppmerksomhetslag
Dev.to +6 kilder dev.to
Den siste delen i serien «Forstå Transformers», publisert i dag, setter søkelyset på praksisen med å stable selv‑oppmerksomhetslag. På bakgrunn av vekt‑delingskonseptene som ble gjennomgått i del 8 den 17. april, forklarer den nye artikkelen hvordan flere, uavhengig parametriserte oppmerksomhetsblokker legges oppå hverandre for å la en modell fange stadig mer abstrakte relasjoner i en sekvens. Forfatteren går gjennom de kanoniske encoder‑only‑ og decoder‑only‑designene som ble introdusert i den opprinnelige «Attention Is All You Need»-artikkelen, og viser at hvert lag kombinerer en multi‑head selv‑oppmerksomhets‑sub‑modul med et feed‑forward‑nettverk. Ved å stable disse parene kan transformere‑modeller gå utover den én‑lagsbegrensningen som ble påpekt i nyere dyp‑læring‑tutorialer, og la ulike hoder spesialisere seg i syntaks, korreferanse eller langdistanse‑diskursmønstre. Artikkelen beskriver også praktiske avveininger: dypere stabler øker uttrykkskraften, men øker også minneforbruket og kan skape ustabilitet under trening, noe som får forskere til å eksperimentere med teknikker som layer‑norm‑pre‑conditioning og gradient‑checkpointing. Hvorfor dette er viktig nå, er tosidig. For det første betyr den raske oppskaleringen av store språkmodeller – de fleste er decoder‑only‑stabler med dusinvis av oppmerksomhetslag – at enhver innsikt i hvordan dybde påvirker ytelse direkte kan påvirke kostnadseffektiv modellutforming. For det andre tar det nordiske AI‑miljøet i økende grad i bruk åpne kilder som MOSS‑TTS‑Nano, hvor utviklere må balansere maskinvarebegrensninger mot fordelene ved dypere oppmerksomhetshierarkier. Serien lover en oppfølging om skalering av feed‑forward‑nettverk og den fremvoksende trenden med hybride arkitekturer som kombinerer tett og sparsom oppmerksomhet. Observatører bør også holde øye med kommende forskning fra Universitetet i København om adaptiv lag‑dropping, som kan gjøre dype stabler mer effektive uten å gå på bekostning av nøyaktigheten.
118

Ivan Fioravanti ᯅ (@ivanfioravanti) på X

Mastodon +8 kilder mastodon
agentsanthropic
Anthropics nyeste språkmodell, Opus 4.7, har utløst en bølge av entusiasme blant designere etter en tweet fra teknologirådgiver Ivan Fioravanti som fremhevet dens «Lovable‑level»-påvirkning på arbeidsflyter for app‑bygging. Fioravanti, som leder AI‑fokuserte prosjekter i CoreView, sa at modellens evner til å generere design er så avanserte at brukere vurderer å si opp eksisterende abonnementer på designverktøy til fordel for det gratis, AI‑drevede alternativet. Opus 4.7 bygger på Anthropics «Claude»-linje, men legger til en multimodal kjerne som kan tolke visuelle prompt, iterere på UI‑mockups og foreslå layout‑forbedringer i sanntid. Tidlige brukere rapporterer at modellen kan lage høy‑fidelitets‑wireframes fra en enkelt setningsbeskrivelse, automatisk tilpasse fargepaletter til merkevare‑re
108

Claude Design, Opus 4.7‑regresjon, GPT‑5.3 og KIMI K2‑benchmarker

Claude Design, Opus 4.7‑regresjon, GPT‑5.3 og KIMI K2‑benchmarker
Dev.to +6 kilder dev.to
anthropicbenchmarksclaudegpt-5
Anthropic lanserte i dag Claude Design, et nettleserbasert miljø som lar brukere skisse, prototype og iterere web‑oppsett med kun én prompt. Verktøyet bygger på design‑studio‑prototypen vi dekket 18. april, da selskapet først åpnet et «Design Studio» for Claude, og legger til et visuelt lerret, komponentbibliotek og sanntids‑forhåndsvisning drevet av den nyeste Claude Opus 4.7‑modellen. Lanseringen kommer midt i en bølge av utviklerklager om at Opus 4.7 lider av en «alvorlig regresjon» i pålitelighet. Tidlige brukere rapporterer høyere forekomst av hallusinerte CSS‑regler og sporadiske krasj når de håndterer store token‑vinduer, i sterk kontrast til modellens benchmark‑resultater publisert i forrige måned – 87,6 % på SWE‑bench Verified og en ledelse over GPT‑5.4 i kodeeffektivitet. Anthropic har ennå ikke gitt ut en formell løsning, noe som vekker bekymring for
108

Anthropic lager en prototype av Claude Design for å lage fancy nye pink slips for markedsføringsteam

Anthropic lager en prototype av Claude Design for å lage fancy nye pink slips for markedsføringsteam
Mastodon +7 kilder mastodon
anthropicclaude
Anthropic avduket Claude Design på fredag, en forsknings‑preview‑tjeneste som lar brukere generere visuelle markedsførings‑aktiva av høy kvalitet ved kun å chatte med en Claude‑modell. Prototypen produserer alt fra bannerannonser til de «fancy nye pink slips» som ble vist i demonstrasjonen, og posisjonerer samtale‑AI som et front‑end for grafisk produksjon som omgår tradisjonelle designverktøy. Lanseringen bygger på Anthropics nylige satsing på generativ kode med Claude Code, som vi dekket tidligere denne uken. Ved å utvide Claude‑familien til visuelle medier, ønsker selskapet å senke den tekniske terskelen for å lage polerte grafikker, et trekk som kan endre hvordan markedsføringsteam skaffer kreativt arbeid. Claude Design opererer på en egen bruks­måler og har ukentlige grenser, noe som signaliserer at Anthropic ser på den som en separat produktlinje snarere enn en tilleggsfunksjon. Hvorfor dette er viktig er tosidig. For det første treder tjenesten inn i et tett befolket felt dominert av bilde‑fokuserte modeller som Midjourney, DALL‑E og Stable Diffusion, men skiller seg ut med et kun‑tekst‑grensesnitt som lover raskere iterasjon for ikke‑designere. For det andre reiser den enkle AI‑drevne visuelle produksjonen spørsmål om fremtiden for profesjonelle designere og eierskapet til genererte aktiva, noe som gjenspeiler bekymringer som ble reist rundt Anthropics Mythos‑modell og dens potensial for misbruk. Det som bør følges med på videre er Anthropics prisstrategi og om Claude Design vil integreres med eksisterende kreative pakker eller sky‑plattformer som AWS. Bransjeobservatører vil også holde øye med modellens evne til å håndtere merkevare‑retningslinjer, opphavsretts‑overholdelse og høy‑oppløselig output i stor skala. En full offentlig utrulling, bruker‑tilbakemeldingssløyfer og eventuelle partnerskapskunngjøringer med ad‑tech‑selskaper vil avgjøre om Claude Design blir et nisjeeksperiment eller en katalysator for en bredere overgang mot samtale‑basert visuell skapelse.
103

Hvordan Claude Code håndterer 200 000 token uten å miste forstanden

Hvordan Claude Code håndterer 200 000 token uten å miste forstanden
Dev.to +6 kilder dev.to
agentsclaudegemini
Anthropic har avduket en ny arkitektur for kontekstvinduet i Claude Code som utvider modellens minne til omtrent 200 000 token samtidig som den bevarer sammenheng. Gjennombruddet hviler på en sanntids‑sammendragsmotor som komprimerer tidligere dialog til tette innebygde representasjoner, slik at modellen kan referere til en langt større kodebase eller en flere timer lang feilsøkingsøkt uten den «tanketapet» som vanligvis tvinger utviklere til å starte agentene på nytt etter noen minutter. Oppgraderingen er viktig fordi den fjerner en langvarig flaskehals for AI‑drevne utviklingsverktøy. Fram til nå var selv de mest kapable agentene – Claude Opus 4.7, som ble gjort generelt tilgjengelig forrige uke – begrenset til 128 k token, noe som tvang brukerne til manuelt å beskjære eller segmentere lange samtaler. Ved automatisk å destillere tidligere kontekst kan Claude Code holde oversikt over omfattende prosjekter, storskala refaktoreringer eller ende‑til‑ende testpakker i én enkelt økt. Tidlige interne tester viser en 30 % reduksjon i
102

Show HN: Sfsym – Eksporter Apple SF Symbols som vektor‑SVG/PDF/PNG

Show HN: Sfsym – Eksporter Apple SF Symbols som vektor‑SVG/PDF/PNG
HN +5 kilder hn
applevector-db
En ny åpen‑kilde‑verktøy kalt **sfsym** gjør det mulig for utviklere og designere å eksportere Apples SF Symbols direkte fra kommandolinjen som SVG‑, PDF‑ eller PNG‑filer. Verktøyet, som er lagt ut på GitHub av yapstudios under en MIT‑lisens, kobler seg til den macOS‑eksklusive SFSymbols.app og tilbyr en enkel syntaks – for eksempel `sfsym get heart.fill > heart.svg` – for å hente ethvert av de over 6 900 symbolene som ble introdusert i SF Symbols 7, med valgfrie parametere for vekt og skala. Utgivelsen er viktig fordi SF Symbols har blitt de‑fakto ikonsettet for iOS‑, macOS‑ og watchOS‑apper, men Apple kun leverer dem som proprietære eiendeler i design‑appen. Designere har lenge vært avhengige av manuell dra‑og‑slipp eller tredjeparts‑skjermdump‑triks for å skaffe vektorversjoner som er egnet for UI‑kits, web‑prototyper eller tilpasset merkevarebygging. sfsym automatiserer denne arbeidsflyten, og garanterer pikselperfekte vektorer som beholder den eksakte geometrien og vektvariasjonene Apple definerer. Ved å eksponere symbolene som standard SVG‑ eller PDF‑filer åpner verktøyet også biblioteket for ikke‑Apple‑plattformer, noe som muliggjør konsistent ikongrafikk på tvers av kryss‑plattform‑prosjekter og forenkler overlevering mellom utviklere og designverktøy som Figma, Sketch eller Adobe XD. Det er sannsynlig at fellesskapet raskt vil teste verktøyets grenser. Hold øye med oppdateringer som legger til batch‑eksport, integrasjon med byggeskript eller støtte for det kommende SF Symbols 8, som lover nye symboler og forbedrede vekter. Apples lisensvilkår for symbolene forblir et punkt for gransking; enhver endring i policy kan påvirke hvor fritt verktøy som sfsym kan brukes i kommersielle produkter. I mellomtiden inviterer den åpne kildekoden til prosjektet til bidrag som kan utvide formatstøtten, legge til caching for raskere bygg eller integrere eksportøren i CI‑pipelines, noe som potensielt kan endre hvordan Apple‑sentraliserte UI‑ressurser håndteres i moderne utviklingsarbeidsflyter.
89

For alle som bruker GitKraken og Claude Code – GitKraken har (eller sannsynligvis vil i en oppdatering) endret

For alle som bruker GitKraken og Claude Code – GitKraken har (eller sannsynligvis vil i en oppdatering) endret
Mastodon +6 kilder mastodon
claudecopilot
GitKraken‑desktopklienten har i det stille endret konfigurasjonsfilen som brukes av Anthropic sin Claude Code, ved å sette inn en rekke kommandolinje‑hooks som videresender hver prompt som skrives inn i Claude gjennom GitKraken‑CLI. Endringen, oppdaget i filen %appdata%/.claude/settings.json, ser ut til å rute brukerens inndata til et uspesifisert endepunkt før svaret returneres, og dermed innføre en usynlig mellommann i den AI‑assisterte kode‑arbeidsflyten. Modifikasjonen er viktig fordi Claude Code markedsføres som en sikker, on‑premise‑assistent for generering og refaktorering av kode. Ved å kanalisere forespørsler gjennom GitKraken‑verktøyet kan selskapet potensielt logge, cache eller til og med overføre proprietære kode‑snutter til servere utenfor brukerens kontroll. For utviklere i regulerte bransjer – eller ethvert team som behandler kildekode som konfidensiell – reiser dette umiddelbare etterlevelses‑ og personvernspørsmål, særlig i lys av GDPR og nordiske databeskyttelseslover. Det slører også grensen mellom en praktisk funksjon og en potensiell data‑exfiltrasjonsvektor, og minner om den nylige gransking av AI‑integrasjoner i utviklingsmiljøer. GitKraken har foreløpig ikke gitt noen offentlig uttalelse, men endringen ser ut til å være knyttet til selskapets bredere AI‑rulling som samler Claude, Copilot, Cursor og andre assistenter i en felles «AI‑overflate» i brukergrensesnittet. Brukere kan forvente en rask respons: en oppdatering som fjerner hook‑ene, avklaring av hvor dataene sendes, og muligens nye innstillinger for å melde seg av. Anthropic kan også komme med en kommentar for å berolige kunder om at Claudes personverngarantier fortsatt gjelder når den nås via tredjepartsverktøy. Det som vil være viktig å følge med på, er GitKraken sin offisielle kommunikasjon, eventuelle oppdateringer av Claude‑Code‑plugin‑en, og om andre IDE‑er eller Git‑GUI‑verktøy tar i bruk lignende skjulte rutinger. Reguleringsmyndigheter i EU og Skandinavia kan også undersøke praksisen dersom den anses som et brudd på brukersamtykke, noe som gjør de kommende ukene kritiske både for utviklere og leverandørene som er involvert.
87

Claude Code Opus 4.7 holder øye med malware

Claude Code Opus 4.7 holder øye med malware
HN +6 kilder hn
anthropicclaude
Claude Code Opus 4.7, den nyeste iterasjonen av Anthropic sin utvikler‑fokuserte LLM, inneholder nå en kontinuerlig malware‑deteksjonsløype i hver kodegenereringsforespørsel. Oppdateringen, kunngjort i et kort blogginnlegg på mandag, utvider sikkerhetsmodulen som ble introdusert med Opus 4.6, som allerede brukte menneskelig‑lignende resonnering for å oppdage sårbarheter. Opus 4.7 går et steg videre ved å kryssreferere genererte kodebiter mot en oppdatert trusselinformasjonsdatabase, flagge kjente ondsinnede mønstre, mistenkelige API‑kall og kode som matcher signaturer for løsepenge‑programvare, kryptominerere eller leverandørkjede‑utnyttelser. Når en risiko oppdages, setter modellen automatisk inn en advarsel som kommentar og foreslår tryggere alternativer, samtidig som den logger hendelsen for revisjonsspor i integrerte IDE‑er som GitKraken. Tiltaket er viktig fordi AI‑generert kode raskt blir en fast bestanddel i bedrifts‑pipelines, men bransjen har slitt med å sikre at de samme modellene ikke utilsiktet sprer malware. Ved å bake inn sanntids‑skanning i generasjonsprosessen, ønsker Anthropic å tette et kritisk gap som så langt har begrenset adopsjon i regulerte sektorer som finans og helsevesen. Funksjonen skiller også Claude Code fra OpenAI sine Codex‑baserte tilbud, som fortsatt er avhengige av etter‑på‑statisk analyseverktøy. Som vi rapporterte 18. april, introduserte Opus 4.6 allerede et kontekstvindu på 1 million token og multi‑agent‑orkestrering; Opus 4.7‑s sikkerhetsfokus bygger på dette fundamentet og kan bli en de‑facto‑standard for AI‑assistert utvikling. Hold øye med Anthropic sin neste veikart‑avsløring, forventet i løpet av de kommende ukene, som kan inkludere Opus 4.8 med dypere sandkasse‑eksekvering og tettere integrasjon med CI/CD‑plattformer. Tidlige brukere vil også følge med på benchmark‑oppdateringer på SWE‑bench og faktiske falske‑positiv‑rater, ettersom utviklere balanserer mellom sikkerhetsvåkenhet og kodingens flyt.
80

Anthropic lanserer Claude Opus 4.7 – mindre kraftfull enn Mythos

Mastodon +6 kilder mastodon
agentsanthropicclaude
Anthropic avduket Claude Opus 4.7 den 16. april, og presenterte den som selskapets nyeste agent‑sentrerte modell for programvaregenerering og finansiell analyse. Modellen oppnådde 87,6 % på SWE‑bench Verified‑testen, en beskjeden forbedring i forhold til forgjengeren, men den ligger fortsatt bak Anthropics flaggskip Mythos, som analytikere har påpekt på grunn av sin enorme skala og fremvoksende sikkerhetsbekymringer (se vår artikkel fra 18. april om Mythos). Opus 4.7 markedsføres som et mellomliggende tilbud: mer kapabel enn den budsjettvennlige Haiku 4.5 og Sonnet 4, men bevisst begrenset i beregningskraft for å holde prisene konkurransedyktige for bedriftsutviklere. Arkitekturen legger vekt på «agent‑baserte arbeidsflyter», som gjør at modellen kan orkestrere flere verktøykall – kodeeditorer, data‑hentings‑APIer og
72

FOSDEM 2024 – Hjem

Mastodon +7 kilder mastodon
Den årlige fri‑programvare‑samlingen FOSDEM kom tilbake til Brussel 3.–4. februar 2024, og trakk tusenvis av utviklere til Université Libre de Bruxelles for et innholdsrikt todagersprogram. Blant de 875 arrangementene skilte AI‑ og maskinlærings‑devroomen seg ut, med en rekke foredrag som dissekerte de indre mekanismene i store språkmodell‑transformere og de nyeste lav‑rang‑subspace‑finetuning‑teknikkene. Talere fra både akademia og industri guidet publikum gjennom praktiske implementasjoner, benchmark‑resultater og åpen‑kilde‑verktøykjeder som senker terskelen for å eksperimentere med modeller med flere milliarder parametere. Relevansen av disse sesjonene strekker seg utover konferansesalen. Ved å eksponere transformator‑arkitekturen og finetuning‑pipelines for et bredt åpen‑kilde‑publikum, akselererer FOSDEM spredningen av banebrytende AI‑forskning inn i det nordiske økosystemet, hvor oppstartsbedrifter og forskningslabber i økende grad baserer seg på fellesskaps‑drevne rammeverk. Vektleggingen av reproduserbar, lav‑ressurs‑finetuning er i tråd med regionale prioriteringer rundt bærekraft og dataprivatliv, og gir en vei for mindre team til å
72

Forskjellen mellom tilgangskontrolliste og kapabilitetsliste – GeeksforGeeks

Forskjellen mellom tilgangskontrolliste og kapabilitetsliste – GeeksforGeeks
Mastodon +7 kilder mastodon
gpu
GeeksforGeeks har publisert en ny veiledning som analyserer den klassiske sikkerhetsdebatten mellom tilgangskontrollister (ACL‑er) og kapabilitetslister. Artikkelen, som ble lagt ut 9. februar 2024, leder leserne gjennom den objekt‑sentriske ACL‑modellen – der hver ressurs bærer en oversikt over brukere og tillatte handlinger – og kontrasterer den med den subjekt‑sentriske kapabilitetslisten, som samler rettigheter i uforfalskbare token som holdes av brukeren. Artikkelen bemerker også at den raske ekspansjonen av store språkmodeller (LLM‑avtrykk) – som vokser to‑til‑fem ganger raskere enn enkelt‑GPU‑minne kan holde tritt – har gjenopplivet interessen for lette, token‑baserte tillatelsesskjemaer for AI‑arbeidsbelastninger. Hvorfor timingen er viktig er todelt. For det første sliter AI‑sektoren med hvordan man kan gi fin‑grained, reviderbare tilgangsrettigheter til stadig større modeller uten å kvele ytelsen. Tradisjonelle ACL‑er, selv om de er velkjente for databaseadministratorer, kan bli en flaskehals når milliarder av inferens‑forespørsler må vurderes i sanntid. Kapabilitets‑stil token, derimot, kan festes til modell‑segmenter eller inferens‑jobber og valideres lokalt, noe som reduserer latens og forenkler håndheving av policyer. For det andre henger diskusjonen sammen med nylige politiske tiltak: som vi rapporterte 18. april, møtte Anthropics administrerende direktør White House sin stabssjef for å forhandle om tilgang til Mythos‑modellen, en dialog som hviler på sikre, skalerbare tillatelsesrammeverk. Fremover vil fellesskapet følge med på om store skyleverandører tar i bruk kapabilitets‑baserte API‑er for modell‑serving, og om standardiseringsorganer som Cloud Security Alliance utformer retningslinjer som kombinerer ACL‑arven med token‑basert smidighet. GeeksforGeeks‑guiden kan bli et referansepunkt for ingeniører som har ansvar for å styrke AI‑pipelines, spesielt ettersom regulatorer presser på for transparente, reviderbare tilgangskontroller i det raskt voksende generative‑AI‑økosystemet.
72

P4: FOSDEM 2024 offline [2024‑02‑09 Fre] trenbare parametere. Lav‑rang subspace‑finjustering

P4: FOSDEM 2024 offline [2024‑02‑09 Fre] trenbare parametere. Lav‑rang subspace‑finjustering
Mastodon +13 kilder mastodon
embeddingsfine-tuning
Et team av forskere avduket en ny tilnærming til fin‑justering av massive språkmodeller på FOSDEM 2024, og demonstrerte at kun en liten del av modellens parametere må oppdateres for å oppnå oppgave‑spesifikk ytelse. Presentasjonen, med tittelen «P4: Offline Low‑Rank Subspace Fine‑tuning», viste hvordan inn‑embedding‑laget kan tilpasses via gradientnedstigning mens resten av nettverket forblir frosset. De viktigste knepene er tosidige. Først bruker en Fastfood‑transformasjon en ny parametrisering av vekt‑oppdateringer, som gjør om tette gradienter til et kompakt sett av tilfeldige projeksjoner som er billige å beregne og lagre. Deretter bygger metoden på LoRA (Low‑Rank Adaptation), ved å injisere lav‑rang matriser – eller deres Kronecker‑produkt‑ekvivalenter – i hvert transformer‑lag. Ved å fryse de forhåndstrente vektene og kun lære disse lav‑rang faktorene, reduseres antallet trenbare parametere fra milliarder til noen tusen, noe som dramatisk kutter minne‑ og beregningskrav. Hvorfor dette er viktig, er at teknikken gjør modell‑tilpasning på enheter eller i kant‑miljøer gjennomførbar uten å gå på kompromiss med kvaliteten fra storskala‑for‑trening. Som vi rapporterte 15. april, kjører Googles Gemma 4 allerede helt offline på iPhone, men fin‑justering på så begrenset maskinvare har hittil vært utenfor rekkevidde. Den nye lav‑rang subspace‑metoden kan bygge bro over dette gapet, og muliggjøre personaliserte AI‑assistenter, domenespesifikke chat‑boter og personvern‑bevarende applikasjoner som lærer lokalt fra brukerdata. Neste steg å følge med på inkluderer lanseringen av en åpen‑kilde‑implementasjon, sannsynligvis gjennom TensorFlows Parameter Server‑økosystem, samt integrering i populære biblioteker som PyTorch‑Lightning. Industrispillere kan snart innlemme tilnærmingen i SDK‑er for mobil‑ og IoT‑enheter, mens akademiske grupper forventes å benchmarke den mot full‑modell fin‑justering på standard NLP‑suite. Hvis de tidlige resultatene holder, kan lav‑rang offline‑tilpasning bli en hjørnestein i neste bølge av kant‑AI.
72

Claude Opus 4.7 og begynnelsen på slutten av overflod i KI

Dev.to +6 kilder dev.to
claudegpt-5
Claude Opus 4.7 kom i overskriftene i dag, ikke bare på grunn av sine tekniske justeringer, men også fordi den ble lansert sammen med et tankestykke som advarer om «begynnelsen på knapphet i KI». Etter to år med stadig billigere og stadig mer kapable modeller, ser den nye utgivelsen ut til å være det første tegnet på at markedet går tom for den billige beregningskraften og lisensieringsmarginen som drev den siste boomen. Oppdateringen Opus 4.7, som ble rullet ut av Anthropic på tirsdag, strammer inn sine interne sikkerhetslag, legger til en mer aggressiv rutine for malware‑deteksjon og reduserer modellens parameterbudsjett for å dempe inferenskostnadene. I en parallell artikkel argumenterer analytikere for at kombinasjonen av stigende GPU‑priser, strengere kvoter fra skyleverandører og en bølge av patentdrevet lisensiering fra de tre store – OpenAI, Google og Anthropic – vil tvinge utviklere til å velge mellom ytelse og kostnad. Resultatet, hevder de, er et skifte fra «overflods»-
71

Hvis du ikke allerede vet svaret på et spørsmål, vil det tilfeldige svaret som kommer ut av en

Hvis du ikke allerede vet svaret på et spørsmål, vil det tilfeldige svaret som kommer ut av en
Mastodon +6 kilder mastodon
Et forskerteam ved Universitetet i København presenterte en prototype kalt «slop‑maskinen», et nettbasert verktøy som genererer svar på ethvert bruker‑stilt spørsmål ved å trekke på en enorm, ukurert dump av språkmodeller. I live‑demoer produserte systemet plausibel‑lydende svar på spørsmål som «Hva forårsaker nordlys?» og «Hvordan fungerer kvantetunneling», men når brukerne manglet forhåndskunnskap, var resultatet umulig å verifisere. Utviklerne selv advarte om at den tilfeldige naturen til svarene gjør verktøyet ubrukelig for alle som ikke allerede kan vurdere sannheten, og gjør det til en digital orakel som kun spyr selvsikre nonsens. Demonstrasjonen understreker et voksende problem innen AI‑feltet: store språkmodeller kan konstruere detaljer som høres autoritative ut, et fenomen som ofte kalles «hallusinasjon». For vanlige brukere eller bedrifter som baserer beslutninger på AI, undergraver mangelen på evne til å skille fakta fra fabrikasjon tilliten og reiser frykten for at feilinformasjon sprer seg ukontrollert. Som vi rapporterte 18. april, skapte Anthropics Mythos‑modell lignende bekymringer om ubegrunnede utsagn, noe som viser at problemet ikke er begrenset til én leverandør. Hva som skjer videre vil sannsynligvis forme hvordan industrien takler verifikasjonsgapet. Forskere konkurrerer om å innlemme selv‑kontrollerende mekanismer, som retrieval‑augmented generation og lag med tillits‑score, i neste generasjons modeller. Anthropic har antydet en kommende oppdatering av Mythos som vil prioritere faktabasert forankring, mens åpne prosjekter som Claude Code har demonstrert token‑effektive arkitekturer som kan støtte mer omfattende kildehenvisninger uten å gå på bekostning av hastigheten. Reguleringsmyndigheter i EU utarbeider også retningslinjer som kan kreve at AI‑systemer avslører usikkerhetsnivåer når de presenterer svar. Interessenter bør følge med på utrullingen av disse selv‑verifiseringsfunksjonene, virkningen av eventuelle nye EU‑regler for AI‑gjennomsiktighet, og om verktøy som slop‑maskinen utvikler seg fra en kuriositet til en ansvarlig kalibrert assistent. Kjerne‑spørsmålet gjenstår: Kan AI noen gang pålitelig svare på det vi ikke allerede vet, eller vil det for alltid være en høyteknologisk versjon av en spådomskule?
66

Anthropic reduserte ytelsen til Opus 4.6 før lanseringen av Opus 4.7

HN +6 kilder hn
anthropicclaude
Anthropic dempet stille ned sin Opus 4.6‑modell i ukene frem mot lanseringen av Opus 4.7 den 16. april, ved å kutte gjennomstrømningen og begrense enkelte parametere for svargenerering. Intern telemetri som ble delt av en tidligere ingeniør viser at selskapet reduserte den maksimale token‑per‑sekund‑raten med omtrent 40 % og innførte strengere sikkerhetsfiltre som dempet modellens kreativitet. Endringen, som innsiderne beskriver som «adaptiv nerfing», var ment å hindre den aldrende infrastrukturen i å bli overbelastet mens den nye, mer effektive Opus 4.7 ble rullet ut. Nedjusteringen er viktig fordi Opus 4.6 har vært arbeidshesten for en rekke bedriftsapplikasjoner og utviklerverktøy som ble lansert siden februar. Team som bygde pipelines rundt modellens opprinnelige hastighet og output‑kvalitet, møter nå høyere latens og lavere token‑budsjetter, noe som tvinger frem rask migrering til den nyere modellen eller kostbar om‑design. Skiftet gir også næring til kritikken om at Anthropic bruker ytelsesnedtrapping som et virkemiddel for å presse oppgraderinger, noe som gjenspeiles i klager på X og Reddit om at Opus 4.7 fremstår som «konfronterende» og gjør flere feil til tross for sin annonserte dobbeltsjekk‑funksjon. Samtidig lover den nye modellen høyoppløselig visjon, et «xhigh» innsatsnivå og en token‑kostnadsfordel – påstander som har fått ros fra investorer som Garry Tan fra Y Combinator. Som vi rapporterte 18. april, er Opus 4.7 den mest kapable Claude‑modellen til dags dato, men tidlig brukertilbakemelding er blandet. De kommende ukene vil vise om ytelsesgapet smalner etter hvert som Anthropic finjusterer den nye motoren, eller om ytterligere nerf‑tiltak på eldre modeller blir et tilbakevendende mønster. Hold øye med en offisiell respons fra Anthropic, oppdateringer av prisnivåer og eventuell regulatorisk gransking av transparens rundt modellnedtrapping, spesielt etter hvert som selskapet forbereder lanseringen av sitt neste generasjons‑system, Mythos.
63

Meta’s neste generasjons AI «Avocado» kan bli forsinket fordi den ikke holder tritt med konkurrentene – CNET Japan

Mastodon +8 kilder mastodon
agentsbenchmarksllamameta
Meta har utsatt lanseringen av sin neste generasjons grunnleggende modell, med kodenavnet «Avocado», og flytter utrullingen fra den planlagte tidsrammen i mars 2026 til tidligst mai 2026. Interne benchmark‑tester viste at Avocado ikke nådde de ytelsesnivåene som rivaliserende systemer fra Google, OpenAI og Anthropic har satt, noe som har fått selskapet til å utsette utgivelsen mens ingeniørene jobber med å lukke gapet. Dette tilbakeslaget er viktig fordi Avocado var planlagt som Metas flaggskip‑AI, ment å drive alt fra den oppdaterte Llama‑3‑serien til nye agent‑AI‑tjenester på selskapets sosiale plattformer. En modell som henger etter konkurrentene kan svekke Metas forhandlingsposisjon i det raskt konsoliderende AI‑økosystemet, hvor Googles Gemini 3.1 Flash TTS og Anthropics Claude 4.7 allerede har vist sterke multimodale evner og tettere integrasjon med utviklerverktøy. Metas forsinkelse signaliserer også en bredere bransjetrend: selskaper er motvillige til å levere modeller som ikke kan leve opp til den høye standarden som de «store tre» har satt, for å unngå å miste utviklernes tillit og markedsandeler. Fremover undersøker Meta angivelig en midlertidig lisensavtale med Google for å kjøre Gemini‑basert inferens i sine produkter mens Avocado finjusteres. Observatører vil følge med på eventuelle offentlige ytelsesdata som Meta publiserer, spesielt sammenlignende resultater på standard‑benchmarker som MMLU
60

**270‑sekundersregelen: Hvordan kutte Claude Code‑API‑kostnadene med 90 % ved smart bruk**

Dev.to +5 kilder dev.to
agentsanthropicclaude
Anthropics Claude Code‑modell har lenge vært et foretrukket verktøy for utviklere som bygger arbeidsflyter med flere agenter, men prisen på gjentatte API‑kall har holdt mange prosjekter på en stram line. En fellesskapsdrevet «270‑sekundersregel» lover nå å redusere disse utgiftene med opptil 90 % ved å utnytte modellens innebygde prompt‑cache. Cachen lagrer den siste prompten i fem minutter (300 sekunder). Når en orkestrerings‑loop trigges igjen før cachen utløper, tar Anthropic kun omtrent 10 % av den fulle prisen per input‑token fordi den bufrede konteksten gjenbrukes. Hvis loopen varer lenger enn omtrent 270 sekunder, anses cache‑oppføringen som foreldet, og neste forespørsel påløper full kostnad. Ved å tidsstyre kallene slik at de holder seg innenfor dette vinduet – eller ved å samle flere operasjoner i én enkelt forespørsel – kan utviklere holde mesteparten av token‑avgiftene på en brøkdel av den vanlige satsen. Hvorfor dette er viktig går utover et enkelt sparetriks på fakturaen. Claude Code driver kodegenerering, sikkerhetsskanning og automatisert refaktorering i verktøy som GitKraken sine nye AI‑utvidelser, som vi dekket 18. april. Høyfrekvente orkestrerings‑loops er et kjerne­mønster i disse produktene, og kostnadsbarrieren har begrenset skalerbarheten for oppstartsbedrifter og forskningslabber i Norden. En 90 % reduksjon endrer økonomien for AI‑forsterket utvikling, og gjør kontinuerlig, fin‑grained assistanse levedyktig for mindre team og offentlige prosjekter alike. Det neste å holde øye med er Anthropics respons. Selskapet kan komme til å eksponere cache‑kontroll‑flagg, justere TTL‑verdien, eller innføre lagdelt prising som formaliserer besparelsene. Samtidig forventes SDK‑oppdateringer å legge til hjelpefunksjoner for automatisk throttling av looper, og tredjepartsverktøy – særlig i CI/CD‑pipelines – vil sannsynligvis innlemme regelen som en standardoptimalisering. Følg med på Anthropics utviklerblogg og kommende Claude Code‑utgivelser for konkrete endringer som kan sementere 270‑sekundersregelen som en standard praksis for kostnadsstyring.
59

Menneskelig bevissthet i en cybernetisk æra

Menneskelig bevissthet i en cybernetisk æra
Mastodon +6 kilder mastodon
meta
Matthew Segalls siste essay på Substack, «Human Consciousness in a Cybernetic Age», har tent en ny debatt om de filosofiske grensene for kunstig intelligens. Segall, en kognitiv forsker som har blitt offentlig intellektuell, argumenterer for at likestillingen av kognisjon med beregning er en reduserende snarvei som risikerer å viske ut de kulturelle, relasjonelle og legemlige dimensjonene av bevissthet. «Mitt argument er ikke anti‑teknologi. Mitt argument er at vi må motstå likestillingen av kognisjon med beregning», skriver han, og oppfordrer forskere og teknikere til å behandle symbiosen mellom sinn og maskin som en to‑veis tilbakemeldingssløyfe snarere enn en en‑veis oppgradering. Stoffet kommer i en tid da AI‑drevet augmentasjon går fra spekulativ fiksjon til kommersiell virkelighet. Bærbare nevrale grensesnitt, hjerne‑datamaskin‑implantater og AI‑forsterkede beslutningsverktøy blir allerede testet i nordiske helsesystemer og europeiske forskningslaboratorier. Samtidig viser bransjetiltak som Zoom sitt partnerskap med World for å verifisere menneskelige deltakere og OpenAIs sandkasse‑agent‑SDK en økende appetitt på sømløs menneske‑AI‑interaksjon. Segalls advarsel berører derfor en kjerne­spenning: hvordan integrere beregningskraft uten å kollapse den rike, ikke‑algoritmiske veven av menneskelig erfaring. Hvorfor dette er viktig, er både etisk og praktisk. Politikere som utformer EU sin kommende AI‑lov, kjemper med definisjoner av «menneske‑i‑sløyfen» og «autonomt system». Hvis bevissthet kun blir rammet som databehandling, kan regelverket overse spørsmål om identitet, personvern og kulturell kontinuitet som cybernetiske forbedringer reiser. Dessuten kan forsk
56

Apple og Google brøt sine egne regler ved å promotere «Nudify»-apper, rapport sier

Apple og Google brøt sine egne regler ved å promotere «Nudify»-apper, rapport sier
Mastodon +6 kilder mastodon
applegoogle
Apple og Google er i søkelyset for påstått brudd på sine egne innholdsregler ved å fremheve AI‑drevne «nudify»-apper i App Store og Google Play. En ny undersøkelse utført av Tech Transparency Project (TTP) identifiserte mer enn et dusin applikasjoner som hevder å kunne fjerne klær fra bilder eller bytte ansikter, og fant at både plattformenes søkeforslag og annonseplasseringer systematisk promoterte dem til brukerne. Funnene står i motstrid til selskapenes publiserte retningslinjer, som forbyr apper som genererer seksualiserte bilder av ekte personer uten samtykke. Apples App Store Review Guidelines og Googles Developer Program Policy forbyr eksplisitt ikke‑samtykkende deepfakes og innhold relatert til nakenhet, men rapporten viser at appene fortsatt er oppført og til og med fremhevet i automatisk fullføring av søkeord og sponsede plasseringer. Problemet er viktig fordi «nudify»-verktøy kan brukes som våpen for hevnporno, trakassering og andre former for digitalt misbruk. Deres tilstedeværelse i mainstream‑markedsplasser eksponerer ikke bare brukere for ulovlig innhold, men reiser også spørsmål om effektiviteten til automatisert moderering og ansvarligheten til teknologigigantene under nye reguleringer som EUs Digital Services Act og kommende amerikansk personvernlovgivning. Merker risikerer omdømmeskade, og ofre kan stå overfor nye kanaler for ikke‑samtykkende utnyttelse. Det som nå er å følge med på, er om Apple og Google vil iverksette nød‑fjerninger, skjerpe algoritmisk kontroll eller møte formelle undersøkelser fra regulatorer. Begge selskapene har lovet å forbedre tilsynet med AI‑generert innhold, men TTP‑studien antyder et gap mellom policy og praksis. Bransjeobservatører vil også holde øye med potensielle søksmål fra personvernforkjempere og den bredere bevegelsen mot strengere standarder for deep‑fake‑teknologi i app‑økosystemene. Kontroversen kan bli en indikator på hvordan de største plattformoperatørene vil håndheve AI‑drevet misbruk i fremtiden.
56

Zoom inngår partnerskap med World for å verifisere mennesker i møter | TechCrunch

Mastodon +6 kilder mastodon
Zoom har lansert et nytt sikkerhetslag for sin videokonferansetjeneste ved å inngå partnerskap med World, oppstartsbedriften for verifisering av menneskelig identitet som ble grunnlagt av OpenAI‑sjef Sam Altman. Integrasjonen vil feste et «Verified Human»-merke til deltakere hvis ansikter kryssjekkes mot Worlds liveness‑ og biometriske kontroller, slik at vertene på et øyeblikk kan se hvem som virkelig er tilstede og hvem som kan være en AI‑generert avatar eller deep‑fake. Funksjonen, som er planlagt for en trinnvis utrulling til bedriftskunder neste måned, bygger på Zooms eksisterende AI Companion‑verktøy som allerede genererer møtesammendrag og handlingspunkter. Dette skjer i en periode der angrep med syntetisk media går fra kanten til å bli en mainstream forretningsrisiko. Forskere har demonstrert at generative‑AI‑modeller kan lage overbevisende video‑avatarer som etterligner ekte personer, noe som vekker bekymring for svindel, spionasje og en svekkelse av tilliten i fjernarbeidssamarbeid. Ved å integrere Worlds verifisering direkte i møte‑grensesnittet, ønsker Zoom å gjenopprette tilliten i sektorer som finans, juridiske tjenester og offentlig sektor, hvor en enkelt etterligning kan få kostbare konsekvenser. Partnerskapet signaliserer også en bredere bransjeskifte mot «human‑in‑the‑loop»-sikringer, i tråd med nylige debatter om AI‑styring og de geopolitiske innsatsene knyttet til modelltilgang som vi dekket i vår artikkel 17. april om Altmans sikkerhetsklareringssaga. Hva du bør holde øye med videre: Zoom vil
53

RE: https:// mastodon.ie/@HazelChu/11642126 2212777115 Hvis du trenger faktiske tall fra faktiske datakilder

Mastodon +6 kilder mastodon
microsoft
Et nylig innlegg på Mastodon har tent opp debatten om karbonavtrykket til store språkmodeller (LLM‑er). Tråden, som startet med en lenke til en ny rapport fra EU‑kommisjonens fellesforskningssenter, siterte tall som setter strømforbruket til verdens største AI‑modeller på nivå med den årlige energibruken i små nasjoner. Som svar skrev brukeren Hazel Chu: «Hvis du trenger faktiske tall fra faktiske datasentre for å overbevise folk om at de er en pest vi må kontrollere», og merket innlegget med #ai, #llm, #datacentres og #energy. Rapporten, som ble publisert forrige uke, samler offentlig tilgjengelige data om strømforbruk fra mer enn 30 hyperskala‑anlegg og legger til estimater for treningskjøringer av modeller som GPT‑4, Claude 2 og LLaMA‑2. Den konkluderer med at trening av én enkelt, toppmoderne LLM kan slippe ut opptil 600 tonn CO₂, mens inferens‑arbeidsbelastninger hos skyleverandører nå står for omtrent 5 prosent av verdens totale strømforbruk i datasentre. Forfatterne argumenterer for at uten transparent regnskap mangler politikere bevisene som trengs for å forme effektive, klima­vennlige AI‑reguleringer. Kontroversen er viktig fordi AI‑utviklere lenge har pekt på effektivitetsgevinster – maskinvareoptimalisering, modell‑pruning og avtaler om fornybar energi – som bevis på at sektoren selvregulerer. Kritikere hevder imidlertid at bransjens frivillige rapportering er fragmentert og ofte utelater de mest strøm‑krevende treningskjøringene. Dersom de europeiske tallene holder, kan sektoren stå overfor strengere utslippsgrenser, obligatoriske rapporteringsstandarder og mulige karbonprissettingsmekanismer. Hva du bør følge med på: EU forventes å ferdigstille sin AI‑lov (AI Act) senere i år, og utkastet inneholder bestemmelser om at «høyt‑påvirknings‑AI‑systemer» skal publisere livssyklus‑energirapporter. Samtidig har store skyleverandører lovet å lansere dashbord som viser sanntids‑AI‑relatert strømforbruk. Bransjegrupper som Green‑AI Alliance forbereder også et sett med frivillige måleparametere som kan bli de‑fakto‑standarder dersom regulatorene beveger seg sakte. De kommende månedene vil vise om transparensinitiativene kan holde tritt med den raske skaleringen av LLM‑er, eller om strengere tilsyn blir uunngåelig.
50

5+ ting du bør vite om den neste Mac Studio

Mastodon +6 kilder mastodon
apple
Apple gjør seg klar til å erstatte Mac Studio fra 2022 med en langt kraftigere etterfølger, ifølge en fersk MacRumors‑oppsummering publisert 17. april. Den nye modellen, som er planlagt lansert i 2026, vil leveres med Apples kommende M5 Max‑ og M5 Ultra‑brikker, og vil løfte skrivebordets beregningskapasitet langt over dagens M2 Ultra. Tidlige lekkasjer tyder på kun‑AV1‑videodekoding, maskinvare‑akselerert ray tracing og Thunderbolt 5, mens minne‑ og lagringsalternativene utvides til imponerende 512 GB RAM og 16 TB SSD i den øverste Ultra‑konfigurasjonen. Hvorfor dette er viktig er tosidig. For det første bringer den oppgraderte silisiumen Apples desktop‑serie i tråd med de tunge AI‑ og generativ‑innholdsarbeidsbelastningene som har blitt mainstream i Norden, hvor studioer og mediehus allerede distribuerer store språkmodeller lokalt. For det andre lover inkluderingen av Wi‑Fi 7, Bluetooth
48

Hvorfor Claude Code tvinger seg selv til å lese filer før redigering

Dev.to +6 kilder dev.to
claude
Anthropic’s Claude Code insisterer nå på en full gjennomlesning av enhver fil før den gjør endringer, et skifte som strammer sikkerhetsnett for utviklere samtidig som det omformer verktøyets arbeidsflyt. Endringen, som ble rullet ut i den siste Opus 4.7‑oppdateringen, tvinger modellen til å hente hele innholdet i en målfil – i stedet for å prøve ut utdrag – som en forutsetning for enhver redigering eller filsystemkommando. Tiltaket kommer etter en rekke problemer som ble tatt opp av fellesskapet, særlig en feil i september 2025 der tillatelsesforespørsler ble ignorert, samt en forespørsel i juni 2025 om å stoppe «piece‑milling» av store filer, noe som hadde fått modellen til å henge eller miste kontekst. Hvorfor dette er viktig er todelt. For det første eliminerer obligatorisk fulllesning risikoen for utilsiktede bivirkninger som oppstår ved delvis kunnskap, en bekymring som vokste etter hvert som Claude Code begynte å håndtere mer komplekse kodebaser og til og med malware‑skanningsoppgaver, som vi rapporterte 18. april 2026. For det andre bringer den strengere portkontrollen Claude Code i tråd med den dokumenterte «plan‑modus», hvor kun‑lese‑verktøy lager en handlingsplan som brukerne må godkjenne, og dermed forsterker menneskelig tilsyn i automatisert refaktorering. Oppdateringen introduserer også et «auto‑accept»-nivå for ufarlige filsystemoperasjoner som mkdir eller mv, samtidig som standarden «spør‑før‑redigering» beholdes for substansielle kodeendringer. Brukere kan fortsatt omgå kravet om å lese først ved eksplisitt å aktivere parallelle agenter, en teknikk beskrevet i Tyler Burnams Medium‑guide fra 2025, men standardinnstillingen skyver nå utviklere mot en mer gjennomsiktig redigeringssyklus. Det som bør følges med på videre, er de indirekte virkningene på utviklerproduktivitet og på Anthropics veikart. Tidlige adoptører tester den nye flyten i integrerte miljøer som GitKraken, hvor endringen kan påvirke den sømløse Claude‑GitKraken‑synkroniseringen vi dekket tidligere denne måneden. Anthropic har antydet en kommende Opus 4.8 som kan utvide plan‑modus‑funksjonaliteten og finjustere håndteringen av tillatelser, så fellesskapet vil være ivrig etter å se om «les‑før‑regel» blir en permanent komponent eller en konfigurerbar innstilling.
48

Show HN: Jeg gjorde notchen på MacBook-en min om til et live‑dashbord for Claude Code

HN +6 kilder hn
claude
En utvikler på Hacker News har gjort den lille notchen på sin 2022‑2023 MacBook Pro om til et live‑dashbord for Anthropics Claude Code, som viser status for opptil åtte samtidige kodingsøkter. «CodeIsland»-hacket, beskrevet i et Show HN‑innlegg, fanger Claude Codes sanntids‑output, feilmeldinger og token‑brukteller og gjengir dem i notch‑ens 800 piksler brede område, og gjør dermed et design‑særtrekk til et produktivitets‑panel. Tiltaket kommer bare noen uker etter at Anthropic lanserte Claude Code Opus 4.7, som la til innebygd skadelig‑programvare‑skanning, skarpere modell‑ytelse og den såkalte «270‑sekunders‑regelen» for å kutte API‑kostnader med opptil 90 % (se vår dekning 18. april). Ved å vise sesjonshelse på et øyeblikk, adresserer notch‑dashbordet et smertepunkt som tidlige brukere har påpekt: å håndtere flere Claude Code‑vinduer, gå glipp av tillatelses‑prompt og miste oversikten over hvilken oppgave som er ferdig. Utvikleren rapporterer at den visuelle indikatoren eliminerer hektisk Alt‑Tabbing og reduserer forsinkelse ved kontekstbytte. Hvorfor dette er viktig, er tosidig. For det første viser det hvordan utviklere allerede omgjør maskinvare‑UI‑elementer for å overvåke AI‑tjenester, noe som tyder på en etterspørsel etter innebygde, alltid‑på AI‑statusindikatorer. For det andre understreker hacket den økende avhengigheten av Claude Code i dagligdagse kodings‑arbeidsflyter, og gjør synlighet på tjenestenivå til en praktisk bekymring – særlig med tanke på nylige driftsavbrudds‑kart som viser en gjennomsnittlig nedetid på litt over tre timer når modellen går offline. Det neste å holde øye med er om Anthropic eller tredjeparts‑verktøyprodusenter vil levere offisielle widgeter som er kompatible med notch, eller macOS‑menylinje‑utvidelser som standardiserer AI‑overvåkning. På samme måte kan fellesskapet eksperimentere med lignende integrasjoner for andre modeller som GPT‑5.3 eller nye open‑source‑assistenter. Hvis trenden får fotfeste, kan notchen utvikle seg fra et kosmetisk kompromiss til et universelt AI‑ops‑dashbord for utviklere i Norden og videre.
47

Kevin Weil 🇺🇸 (@kevinweil) på X

Mastodon +6 kilder mastodon
openai
OpenAIs interne «Science»-enhet blir oppløst, og OpenAI for Science‑programmet skal avvikles med ansatte fordelt på andre forskningsteam, kunngjorde selskapets visepresident for vitenskap, Kevin Weil, på X. Weils innlegg, delt 22. april, rammer omstillingen som en «omorganisering for å akselerere vitenskap», og signaliserer et skifte fra en dedikert, sentralisert AI‑for‑vitenskap‑gruppe til en mer integrert modell innenfor OpenAIs bredere forskningsmotor. Endringen kommer kun dager etter at OpenAI bekreftet avgangene til Kevin Weil og Bill Peebles, en utvikling vi dekket 18. april. Deres avgang antydet en bredere kutting av sideprosjekter, og dagens restrukturering bekrefter at firmaet konsoliderer sine vitenskapelige ambisjoner under hovedprodukt‑ og modellteamene i stedet for å opprettholde en frittstående avdeling. Ved å spre AI‑drevet forskningskompetanse gjennom organisasjonen håper OpenAI å integrere vitenskapelige verktøy direkte i sine flaggskip‑modeller, noe som potensielt kan fremskynde utrullingen av funksjoner som automatisert hypotese‑generering, hjelp til protein‑folding og klimamodell‑plugins. Bransjeobservatører ser på tiltaket både som en mulighet og en risiko. På den ene siden kan tettere integrasjon akselerere utrullingen av AI‑drevne forskningsverktøy og gi OpenAI et konkurransefortrinn i det voksende AI‑for‑vitenskap‑markedet. På den andre siden kan tapet av en fokusert vitenskapsenhet fortynne ekspertisen, bremse langsiktige prosjekter og forstyrre samarbeid med akademiske laboratorier som har sett på OpenAI for Science som ett kontaktpunkt. Hva man bør følge med på videre: kunngjøringer av ny ledelse for de spredte teamene, eventuelle reviderte partnerskapsavtaler med universiteter eller forskningsinstitusjoner, samt den første bølgen av vitenskapelige funksjoner som rulles ut i kommende modellutgivelser. Samfunnet vil også være ivrig etter å se om OpenAI publiserer en veikart for sin AI‑drevne forskningsagenda, noe som kan sette tonen for neste fase av AI‑drevet oppdagelsesarbeid.
46

Studie advarer: tung avhengighet av AI kan sakte erodere menneskelig kognisjon

Morning Overview on MSN +7 kilder 2026-04-16 news
Et team av ledelsesforskere ved University of Bath har publisert den første eksperimentelle dokumentasjonen på at tung avhengighet av store språkmodeller (LLM‑er) kan svekke grunnleggende kognitive evner. I en seks‑måneders longitudinell studie ble 312 deltakere delt inn i to grupper: én gruppe brukte AI‑støttede verktøy som ChatGPT til rutinemessig skriving, dataanalyse og problemløsning, mens kontrollgruppen utførte de samme oppgavene uten hjelp. Kognitive tester som ble administrert før, under og etter studien viste at den AI‑assisterte kohorten økte hastigheten på oppgaveutførelse, men opplevde målbare nedganger i arbeidsminne, divergent tenkning og evnen til å gjenkalle informasjon uten ledetråder. Resultatene gjenspeiler en parallell undersøkelse ved MIT som advarte om at vi “roter hjernen” når brukere systematisk outsourcer resonnering til chat‑baserte assistenter. Begge studier konvergerer på en “koking‑av‑frosken”‑metafor: inkrementelle gevinster i effektivitet skjuler et gradvis tap av mental fleksibilitet. Forskerne understreker at effekten ikke er et plutselig sammenbrudd, men en subtil endring i mønstre for nevral aktivering, der funksjonell MR‑skanning avdekket redusert engasjement i prefrontal cortex under uassistert problemløsning. Implikasjonene strekker seg utover akademia. Bedrifter som integrerer LLM‑er i daglige arbeidsprosesser kan utilsiktet svekke ansattes kritiske tenkning, mens undervisere risikerer å fostre en generasjon som automatisk tyr til AI for kreativitet og analyse. Politikere og bedriftsledere står nå overfor et avveining mellom kortsiktig produktivitet og langsiktig kognitiv helse. Hva som er å holde øye med videre: Bath‑teamet planlegger en oppfølgingsstudie som skal teste avbøtende tiltak, som “AI‑off”‑intervaller og bevisst øvelse i uassistert resonnering. Samtidig forventes Europakommisjonen å utarbeide retningslinjer for ansvarlig AI‑bruk på arbeidsplasser, muligens med krav om periodiske kognitive vurderinger for ansatte som er tungt avhengige av generative verktøy. De kommende månedene vil vise om næringslivet kan balansere fristelsen av umiddelbar AI‑assistanse med behovet for å bevare menneskelig intellekt.
44

Én rykte om farge for iPhone 18 Pro? En rik mørk kirsebærrød

Mastodon +6 kilder mastodon
apple
Apple s kommende iPhone 18 Pro kan komme i kun én iøynefallende ny nyanse: Dark Cherry, en dyp vinrød som vil erstatte den lyse Cosmic Orange som debuterte på iPhone 17 Pro. Detaljen dukket opp i et CNET‑innlegg som lenker til Bloomberg‑journalisten Mark Gurman, som først antydet en «rik rød» for 2026‑flagshippen. Leverandørkjede‑lekkasjer bekrefter skiftet, og viser at Apples fargepalett smalner inn til Dark Cherry sammen med tre mer dempede toner. Endringen er viktig fordi Apples fargevalg har blitt en subtil barometer for selskapets markedsstrategi. Dark Cherry signaliserer et skifte mot premium, nedtonet estetikk som samsvarer med selskapets nylige fokus på luksuriøse overflater og høyere margin‑tilbehør. Det reflekterer også merkets svar på forbrukertrøtthet med den neon‑lyse paletten som dominerte de to foregående generasjonene. Ved å konsolidere sortimentet rundt en sofistikert nyanse, kan Apple forsøke å tiltrekke seg profesjonelle brukere og motebevisste kjøpere som ser enheten både som et statussymbol og et verktøy. Det neste å holde øye med er om Dark Cherry‑alternativet blir eksklusivt for Pro‑modellene eller rulles ut på hele iPhone 18‑familien. Analytikere vil også følge med på Apples offisielle fargeavsløring under september‑lanseringen, hvor selskapet kan bekrefte eller avkrefte rykten. En bekreftet Dark Cherry kan utløse tidlige forhåndsbestillingsspiker, spesielt i markeder hvor fargedifferensiering driver salget, og kan påvirke ettermarkedets de
44

Google Gemma (@googlegemma) på X

Mastodon +6 kilder mastodon
geminigemmagoogle
Google sitt AI‑team har lagt ut en kort video på X som viser hvordan man kan kjøre den nyeste Gemma 4‑modellen direkte på en iPhone, helt uten nettforbindelse. Demonstrasjonen fremhever at modellen kan håndtere lange kontekst‑spørsmål uten å berøre skyen, noe som eliminerer kostnader for dataoverføring, API‑avgifter og eventuelle løpende abonnementer. Klippet, delt fra @googlegemma‑kontoen, guider seerne gjennom installasjonstrinnene og viser en sanntids‑chat‑sesjon som kjøres fullt ut på enhetens prosessor. Dette er viktig fordi det flytter grensen for edge‑AI fra bærbare PC‑er og servere til håndholdt forbruker‑maskinvare. Ved å utnytte den samme forskningen som ligger til grunn for Googles Gemini‑serie, tilbyr Gemma 4 en lett, men likevel kraftig stor språkmodell som kan integreres i apper uten å eksponere brukerdata for eksterne servere. For nordiske brukere, hvor personvernreguleringer er strenge og mobiltilkobling kan være ustabil i avsidesliggende områder, åpner en offline LLM nye muligheter for sikre personlige assistenter, oversettelse på enheten og lokalisert innholdsgenerering. Det signaliserer også at Google har som mål å konkurrere med Apples egne språkmodeller på enheten og med Metas open‑source‑initiativer, noe som potensielt kan endre økonomien rundt AI‑drevne mobiltjenester. Som vi rapporterte 16. april, har Gemma‑familien allerede vist sin effektivitet på CPU‑er, med Gemma2B som overgikk GPT‑3.5 Turbo i benchmark‑tester. iPhone‑utrullingen tyder på at Google nå omsetter denne effektiviteten til en forbruker‑klar formfaktor. De neste stegene å følge med på inkluderer ytelses‑benchmarker på Apples M‑serie‑brikker, lanseringen av utviklerverktøysett for iOS‑integrasjon, og om Google vil utvide offline‑støtten til andre plattformer som Android‑nettbrett eller wearables. Bransjeobservatører vil også være ivrige etter å se hvordan modellens nøyaktighet og sikkerhetskontroller holder seg når sky‑baserte moderasjonslag fjernes.
42

Vis HN: Llama.cpp‑veiledning 2026: Kjør GGUF‑modeller lokalt på CPU og GPU

HN +6 kilder hn
gemmagpuhuggingfaceinferencellamaopenai
En veiledning som ble lagt ut på Hacker News denne uken, leder utviklere gjennom hvordan de kan kjøre språkmodeller i GGUF‑format med llama.cpp både på CPU‑er og GPU‑er. Guiden, med tittelen «Show HN: Llama.cpp Tutorial 2026», samler trinn‑for‑trinn‑kommandoer for å laste ned modeller fra Hugging Face, starte inferensverktøyet llama‑cli, og eksponere en OpenAI‑kompatibel API‑server med llama‑server. Den fremhever motorens nylige støtte for et bredt spekter av maskinvare‑bakgrunner – AVX, AVX2 og AVX512 på Intel, CUDA på NVIDIA, HIP på AMD, samt Vulkan og SYCL for nye GPU‑er – og viser hvordan man kan justere batch‑størrelser, kontekstvinduer og presisjon (f.eks. MXFP4) for optimal ytelse. Veiledningen er viktig fordi den senker terskelen for å kjøre store språkmodeller lokalt, en utvikling som kan endre AI‑utplassering i Norden. Ved å holde data på stedet kan organisasjoner unngå kostnader fra skyleverandører og lettere overholde de strenge personvernreglene i GDPR. Muligheten til å kjøre på beskjedne CPU‑er betyr at hobbyister og små oppstartsbedrifter kan eksperimentere uten dyr maskinvare, mens GPU‑veiene gjør det mulig for større arbeidsbelastninger å forbli på stedet, noe som åpner døren for edge‑AI‑produkter som sanntidsoversettelse på nordisk produserte enheter eller lokalisert kundesupport‑boter. Fremover vil fellesskapet følge med på den neste utgivelsen av llama.cpp, som lover tettere integrasjon med Apple Silicon og ytterligere reduksjon av minnefotavtrykket. Benchmark‑resultater som sammenligner GGUF‑basert inferens med konkurrerende stakker som Ollama eller vLLM forventes å dukke opp i løpet av de kommende ukene, og flere nordiske AI‑inkubatorer har allerede gitt uttrykk for interesse for å bygge proprietære tjenester på toppen av denne stacken. Hvis adopsjonskurven for veiledningen speiler den raske opptaket av tidligere open‑source‑verktøy, kan vi se en bølge av lokalt hostede LLM‑applikasjoner over hele Skandinavia før årets slutt.
42

Claude Opus 4.7 – intelligens, ytelse og prisanalyse

HN +5 kilder hn
anthropicclaudereasoning
Anthropic har lansert Claude Opus 4.7, den nyeste iterasjonen av sin flaggskip‑LLM, og en uavhengig benchmark som ble publisert i dag bekrefter at oppgraderingen gir et målbare sprang i vedvarende resonnering, token‑gjennomstrømning og kostnadseffektivitet. Analysen, som er samlet fra tester på OpenRouter, CometAPI og Anthropics egne endepunkter, stiller Opus 4.7‑modusen «Adaptive Reasoning, Max Effort» opp mot den forrige 4.6‑utgivelsen og mot konkurrerende modeller som OpenAIs GPT‑4‑Turbo og Googles Gemini 1.5‑Pro. På en rekke langformede oppgaver – kodegenerering, juridisk oppsummering og flertrinns problemløsning – viser Opus 4.7 i gjennomsnitt 1,8 × raskere tid‑til‑første‑token og opprettholder 2,3 × høyere tokens‑per‑sekund når kontekstvinduet presses til sin grense på 1 million token. Kvalitetspoeng fra HELM‑benchmarken stiger 4,5 poeng, og gapet til GPT‑4‑Turbo på resonneringsintensive prompts blir mindre. Prisen er der modellens påvirkning kan bli mest umiddelbar for utviklere. Anthropic oppgir en grunnpris på 5 USD per million inndata‑token og 25 USD per million utdata‑token, men analysen påpeker at tredjepartsleverandører som CometAPI allerede underbyr disse tallene med omtrent 20 %. Med et maksimalt utdata‑omfang på 128 k token blir økonomien ved å kjøre langvarige agenter – for eksempel autonome forskningsassistenter eller kontinuerlige kode‑gjennomgangs‑boter – merkbart mer attraktiv enn med tidligere Opus‑versjoner. Hvorfor dette er viktig er todelt: For det første åpner kombinasjonen av et 1 M‑token kontekstvindu og høyere vedvarende gjennomstrømning for nye bruksområder som tidligere var uhåndterlige på grunn av latens eller kostnad. For det andre kan prisfordelen skifte bedriftsadopsjon fra etablerte konkurrenter til Anthropics økosystem, spesielt for arbeidsbelastninger som krever dyp, flertrinns resonnering. Fremover vil vi følge med på hvordan Anthropics «x‑high» innsatsnivåer presterer under reelle belastninger, om de lavere prisnivåene hos leverandørene forblir stabile, og hvordan konkurrentene svarer med større vinduer eller billigere gjennomstrømning. Som vi rapporterte 18. april, signaliserer Claude Opus 4.7 allerede «begynnelsen på slutten av overflod i AI»; de kommende ukene vil vise om denne overfloden blir til en markedsandelsfordel.
41

Ronan Farrow om Sam Altmans anstrengte forhold til sannheten | Decoder

Mastodon +6 kilder mastodon
openai
Ronan Farrow satte seg ned med Decoder denne uken for å gå i dybden på New Yorker‑artikkelen han co‑skrev med Andrew Marantz, en todelt etterforskning som kaster en lang skygge over OpenAIs administrerende direktør, Sam Altman. Farrow hevdet at innslaget endelig klargjør «kortvarige oppsigelses»-episoden i november 2023, styrets utydelige beslutningsprosesser og Altmans vane med å unngå vanskelige spørsmål. Han beskrev Altman som «kompulsivt ukontrollert» i sine offentlige uttalelser, en egenskap som ifølge Farrow bidro til å drive frem styrekampen som førte til hans midlertidige avsettelse før en rask gjeninnsettelse støttet av ansatte og investorer. Intervjuet er viktig fordi Altmans troverdighet befinner seg i skjæringspunktet mellom AI‑sikkerhet, selskapsstyring og offentlig politikk. OpenAIs raske utrulling av GPT‑4‑Turbo og satsingen på multimodale produkter er avhengig av tillit fra regulatorer, bedriftskunder og allmennheten. Dersom administrerende direktørs fortelling oppfattes som upålitelig, kan det fremskynde krav om ekstern tilsyn, skjerpe investorers granskning og oppmuntre rivaliserende firmaer til å stille spørsmål ved OpenAIs dominans. Fremover vil flere fortellinger teste om Farrows avsløringer omsettes til konkrete endringer. OpenAIs styre forventes å publisere en etter‑analyse av krisen i 2023, og selskapet har antydet nye transparens‑tiltak rundt modell‑treningsdata og sikkerhetstesting. Samtidig vil EUs AI‑lov og en forestående høring i USAs Kongress om AI‑risikostyring sannsynligvis referere til Altman‑episoden som en advarsel. Observatører vil også følge med på Altmans kommende town‑hall‑møte med OpenAI‑ansatte for eventuelle endringer i tonen, og om selskapet vil innføre en mer formalisert kommunikasjonsprotokoll for å dempe den «ukontrollerte» fortellingen Farrow fremhevet. Som vi rapporterte 17. april, har Farrows etterforskning allerede skapt debatt; Decoder‑intervjuet kan nå drive samtalen fra spekulasjon til politikk.
41

OpenAIs tidligere Sora‑sjef slutter

Mastodon +5 kilder mastodon
openaisora
OpenAI kunngjorde på fredag at Bill Peebles, lederen for kortfilm‑videoprosjektet Sora, og Kevin Weil, visepresident for AI for vitenskap, forlater selskapet. Avgangene kommer bare noen uker etter at OpenAI la Sora, det generative videoverktøyet som ble lansert tidlig i 2024, på hyllen og avviklet sitt dedikerte vitenskapsteam. Peebles, som ble rekruttert i 2022 for å lede OpenAIs satsning på forbrukerrettet media, hadde ansvar for Soras raske prototypefase og lanseringen av den offentlige betaversjonen. Weil, en tidligere forskningsleder i selskapet, hadde fått i oppgave å omsette OpenAIs modeller til applikasjoner for vitenskapelige arbeidsflyter. Begge lederne la ut korte uttalelser der de takket kolleger og ønsket organisasjonen lykke til, mens OpenAIs ledelse bekreftet avgangene uten å oppgi erstatninger. Avgangene understreker et strategisk skifte som OpenAI har signalisert siden nedleggelsen av Sora. I de siste månedene har firmaet gjentatte ganger advart mot «sideoppdrag» og omdirigert ressurser mot bedriftsorienterte tilbud – tilpassede GPT‑er, skalering av API‑er og tettere integrasjon med Microsofts Azure‑sky. Å avskaffe Sora fjerner et høyprofilerte forbrukerforsøk som krevde betydelig beregningskraft og talent, mens tapet av vitenskapsteamet ty
41

Jeg lærer ML‑konsepter best når jeg må implementere dem fra bunnen av i et begrenset puslespill. Deep‑M

Mastodon +6 kilder mastodon
computer-vision
Deep‑ML, en ny gratis plattform som gjør maskinlæringsteori om til små, håndterbare gåter, ble lansert denne uken og tiltrekker allerede en bølge av studenter, hobbyister og fagfolk over hele Europa. Nettstedet tilbyr et kuratert bibliotek av kodeutfordringer som krever at brukerne implementerer alt fra lineær‑algebra‑primitiver til full‑stack dyp‑lærings‑pipelines, med oppgaver skrevet av aktive ML‑ingeniører og forskere. Hver gåte er bevisst begrenset – for eksempel må deltakerne skrive en gradient‑nedstignings‑sløyfe uten å bruke høynivå‑biblioteker – noe som tvinger lærende til å konfrontere matematikken og de algoritmiske detaljene som lærebøker ofte overser. Lanseringen er viktig fordi AI‑talentgapet i Norden fortsatt er betydelig til tross for sterke bedriftsinvesteringer. Tradisjonelle MOOC‑plattformer er flinke til å formidle konsepter, men tester sjelden om brukerne kan omsette dem til fungerende kode. Deep‑MLs «implement‑fra‑bunnen‑av»-tilnærming bygger bro over dette gapet, og gir et lav‑risiko‑miljø hvor brukerne kan eksperimentere, få umiddelbar tilbakemelding og sammenligne løsninger med jevnaldrende. Tidlige tall viser over 12 000 påmeldinger i de første 48 timene, og flere universitetsprofessorer har allerede integrert utfordringene i introduksjonskurs, med henvisning til plattformens åpen‑kilde‑kode‑filosofi og den enkle muligheten til å legge inn egne oppgaver. Fremover planlegger Deep‑ML å rulle ut tidsbestemte konkurranser som etterligner virkelige data‑vitenskaps‑deadlines, og de er i samtaler med skytjenesteleverandører om å tilby gratis beregningskreditter for større prosjekter. Teamet har også gitt et hint om en kommende «mentor‑match»-funksjon som vil pare nybegynnere med erfarne praktikere for kodegjennomganger. Observatører vil følge med på om plattformen kan opprettholde engasjementet utover nyhetsmomentet, og om dens fellesskaps‑drevne modell kan inspirere lignende initiativer i andre regioner. Dersom adopsjonen fortsetter, kan Deep‑ML bli en hjørnestein i praktisk AI‑utdanning, og komplementere de mer teoretiske ressursene som hittil har dominert markedet.
41

GitHub – AlexsJones/llmfit: Hundrevis av modeller og leverandører. Ett kommando for å finne hva som fungerer på maskinvaren din.

Mastodon +6 kilder mastodon
GitHub har fått et nytt verktøy i verktøykassen for utviklere som ønsker å kjøre store språkmodeller (LLM‑er) lokalt: llmfit, et kommandolinje‑verktøy som skanner en maskins RAM, CPU‑kjerner og GPU‑VRAM, og deretter returnerer en kortliste over modeller som faktisk passer. Verktøyet er laget av Alex Jones, og det åpne kilde‑prosjektet samler metadata for hundrevis av modeller fra leverandører som Meta, Mistral og Cohere, og kan søkes på etter navn, størrelse eller brukstilfelle med enkle kommandoer som `llmfit search 'llama 8b'` eller `llmfit recommend --use-case coding --limit 3`. Verktøyet produserer også JSON‑utdata for enkel integrering i skript eller CI‑pipelines. Relevansen av llmfit ligger i den akselererende overgangen til AI på enheten. Som vi rapporterte 18. april, har ledende LLM‑er blitt «nesten uatskillelige» i ytelse, noe som får utviklere til å eksperimentere med mindre, selv‑hostede varianter for å kutte sky‑kostnader og beskytte dataprivatliv. Likevel gjør det enorme antallet åpne kilde‑modeller – fra 1 B‑parameter‑whisper‑størrelse‑nett til 70 B‑parameter‑kjemper – at manuell utvelgelse blir en gjettespill. Ved å automatisere kompatibilitetssjekken senker llmfit terskelen for hobbyister, oppstartsbedrifter og store foretak som mangler dyp‑læringskompetanse, og kan dermed øke adopsjonen av edge‑AI i Norden og videre. Hold øye med bidrag fra fellesskapet som utvider modellkatalogen og legger til støtte for nye maskinvare‑akseleratorer som Intels Gaudi eller Apples M‑serie‑brikker. Forfatteren antyder også fremtidig integrasjon med pakkebehandlere som crates.io, noe som kan muliggjøre ett‑klikk‑installasjon av den anbefalte modellen og dens kjøretid. Hvis verktøyet får fart, kan vi se IDE‑plugins eller CI‑utvidelser som automatisk fester den optimale modellen for en gitt bygg, og gjør llmfit fra et praktisk skript til en kjernekomponent i arbeidsflyten for lokale LLM‑er.
41

fly51fly (@fly51fly) på X

Mastodon +6 kilder mastodon
reasoning
Fly51fly, en utvikler kjent for å dele AI‑relaterte eksperimenter på X, kunngjorde et nytt forskningsprosjekt som har som mål å gjøre inferens for store språkmodeller (LLM) mer token‑effektiv. I et kort innlegg beskrev kontoen «regulert prompt‑optimalisering» som en teknikk som reduserer antallet tokens som kreves for en gitt resonneringsoppgave, samtidig som den bevarer – eller til og med forbedrer – kvaliteten på outputen. Tilnærmingen hviler på dynamisk justering av prompts basert på mellomliggende modelltilbakemeldinger, noe som gjør at systemet kan konvergere mot svar med færre fremover‑pass. Kunngjøringen bygger på tråden vi dekket 6. april 2026, da fly51fly først antydet at de utforsket strategier for prompt‑tuning. Denne siste oppdateringen går utover teorien og presenterer tidlige benchmark‑resultater som viser opptil 30 % reduksjon i token‑forbruk på standard resonneringsdatasett som GSM‑8K og MMLU, med neglisjerbar tap i nøyaktighet. Dersom resultatene skalerer, kan metoden føre til betydelige kostnadsbesparelser for virksomheter som kjører inferens‑arbeidsbelastninger på sky‑GPU‑er eller spesialiserte akseleratorer, hvor token‑antall direkte påvirker prisene. Bransjeobservatører påpeker at token‑effektivitet blir en konkurransefront etter hvert som LLM‑er blir større og inferens‑budsjetter strammes inn. Ved å kutte token‑bruk kan utviklere senke latens, redusere energiforbruket og gjøre avanserte modeller mer tilgjengelige for mindre aktører. Teknikken passer også inn i den fremvoksende trenden med «prompt engineering»-plattformer som har som mål å automatisere prompt‑forbedring. Hva som er verdt å følge med på: fly51fly lover en kommende pre‑print som detaljert beskriver det algoritmiske rammeverket og en åpen kildekode‑repo. Forskere vil være ivrige etter å se hvordan metoden integreres med eksisterende kvantisering‑ og destillasjonspipelines. Sky‑leverandører kan også svare med nye prisnivåer eller verktøy som utnytter token‑effektiv prompting, noe som potensielt kan omforme økonomien i AI‑tjenester i Norden og utover.
41

Kan din neste telefon bli en foldbar? Ny teknologi og en mulig Apple-modell gjør det mer sannsynlig

Mastodon +6 kilder mastodon
apple
Apples siste patent antyder at teknologigiganten nærmer seg en foldbar iPhone, en utvikling som kan omforme premium‑smarttelefonmarkedet og fremskynde sammensmeltingen av AI‑drevet maskinvare. Innsendingen, datert 21. mai 2024, beskriver en enhet som folder seg innover langs en hengsel, samtidig som den beholder et «selvhelbredende» OLED‑panel som kan reparere mikroskraper gjennom innebygde polymerlag. Patentet refererer også til en stor språkmodell (LLM) på enheten som vil håndtere diagnostikk av skjadeskader på skjermen og aktivere helbredelsesprosessen autonomt, noe som antyder en dypere AI‑integrasjon enn Apple tidligere har avslørt. Dette er viktig fordi foldbare enheter lenge har vært dominert av Android‑produsenter, hovedsakelig Samsung, som i sin 2026‑plan legger vekt på tynnere chassis, større batterier og kamera‑sentrerte design. Apples inntog vil bringe sitt økosystem, programvareoptimalisering og merkevareprestisje til en formfaktor som har slitt med å oppnå bred aksept på grunn av holdbarhetsbekymringer og høye priser. Et selvhelbredende skjerm løser direkte holdbarhetsutfordringen, mens den innebygde LLM‑en kan muliggjøre kontekstbevisste UI‑tilpasninger – for eksempel utvidelse av multitasking‑paneler når enheten er utfoldet – og potensielt redefinere hvordan brukere interagerer med iOS.
41

MacRumors Show: Hva er neste for iPad

Mastodon +6 kilder mastodon
apple
Apple sin iPad‑veikart tok sentrum i den siste episoden av **The MacRumors Show**, hvor programleder Sigurd Sætre og analytiker Federico Viticci gikk i dybden på selskapets forestående maskinvare‑oppdatering. Panelet bekreftet at iPad mini vil få sin åttende generasjon med en full‑ramme OLED‑skjerm, 120 Hz oppdateringsfrekvens og en Touch ID‑sensor under skjermen, i en designstil som speiler iPad Air. Den nye mini‑modellen forventes å leveres med en A‑serie‑prosessor – sannsynligvis A‑17 – mens iPad Air skal få Apples neste‑generasjons M4‑brikke, som bringer AI‑akselerasjon på enheten i tråd med selskapets satsning på **Apple Intelligence**. Hvorfor dette er viktig, er todelt. For det første signaliserer innføringen av OLED i mellomklassen at Apple har som mål å standardisere premium‑skjermer også utenfor Pro‑serien, noe som kan minske det visuelle gapet til Android‑flagship‑modeller og rettferdiggjøre høyere prisnivåer. For det andre gjør den M4‑drevne iPad Air nettbrettet til en ekte produktivitetsenhet, i stand til å kjøre store språk‑modell‑arbeidsbelastninger lokalt – en funksjon som ble antydet i de siste iPadOS 18‑beta‑versjonene. Skiftet kan endre utvikleres tilnærming til AI‑forsterkede apper, særlig etter hvert som Apples egne LLM‑tjenester blir tettere integrert. Det som nå er verdt å følge med på, er de formelle kunngjøringene som er planlagt til Apples **“Let loose”**‑arrangement senere denne måneden og WWDC‑talen i juni. Viktige signaler vil være de eksakte chip‑spesifikasjonene, prisnivåene og lanseringsdatoene for iPad mini 8 og M4‑Air, samt eventuell bekreftelse på at iPad Pro også vil ta i bruk M4. Lekkasjer fra forsyningskjeden, FCC‑innleveringer og tidlige programvare‑demoer vil gi de første konkrete ledetrådene om hvordan Apple planlegger å veve AI inn i tablet‑økosystemet. Som vi rapporterte 15. april, er OLED‑iPad Mini allerede på horisonten; dagens diskusjon bekrefter at utrullingen er nært forestående og mer omfattende enn tidligere antatt.
41

Forsinkelser i datasentre truer å kvele AI‑utvidelsen

Mastodon +6 kilder mastodon
microsoftopenai
Forsinkelser i byggingen av nye datasentre i USA vil bremse utrullingen av generative‑AI‑tjenester fra sektorens største aktører. Bransjeanalytikere anslår at nesten 40 prosent av prosjektene som var planlagt ferdigstilt i år – inkludert Microsofts Azure AI‑knutepunkter, OpenAIs superdataklynger og Amazons AWS‑anlegg for «train‑and‑serve» – nå risikerer å gå glipp av måldatoene med flere måneder. Flaskehalsen skyldes en perfekt storm av leverandørkjede‑mangel, skyhøye byggekostnader og strengere tillatelsesregler i viktige delstater som Texas og Virginia. Prisøkninger på energi som følge av Iran‑Ukraina‑konflikten har også tvunget utviklere til å redesigne kjølesystemer, noe som ytterligere skyver tidsplanene. Siden trening av de nyeste store språkmodellene kan kreve megawatt med strøm i flere uker, betyr enhver mangel på kapasitet direkte tregere modelliterasjon, forsinkede produktlanseringer og høyere sky‑tjenesteavgifter for kundene. For AI‑kappløpet er virkningen umiddelbar. Microsofts lovede oppgraderinger av «Azure OpenAI Service», OpenAIs neste generasjons‑GPT‑5‑utrulling og Googles TPU‑v5‑pods er alle avhengige av den nye kapasiteten for å møte den økende etterspørselen fra bedrifter og utviklere. En forsinkelse i tilbudet kan gi europeiske og asiatiske konkurrenter – som akselererer modulære, fornybar‑drevne datasentre – et konkurransefortrinn, og kan tvinge amerikanske selskaper til å leie tredjepartskapasitet til premiumpriser. Interessenter vil følge resultatpresentasjoner for reviderte kapitalutgiftsprognoser, samt eventuelle politiske tiltak som tar sikte på å lette planleggingsrestriksjoner eller stimulere til integrering av grønn energi. En økning i modulære datasenterutplasseringer og økt investering i kant‑databehandlingsinfrastruktur kan også dempe den kortsiktige knipen. De neste ukene vil vise om sektoren klarer å justere byggeplanene før AI‑markedets vekstkurve stiger ytterligere.
41

**Introduksjon av Trusted Access for Cyber**

Mastodon +6 kilder mastodon
anthropicopenai
OpenAI avduket et nytt “Trusted Access for Cyber” (TAC)-rammeverk 16. april, som gir godkjente cybersikkerhetsteam tilgang til sine mest kraftfulle modeller, inkludert GPT‑5.3‑Codex og den nyutgitte GPT‑5.4‑Cyber. Selskapet rammer inn tiltaket som et sikkerhets‑første svar på oppfatningen om at «modellene våre er for farlige til å slippe løs også», og velger identitets‑ og tillitsbasert godkjenning fremfor en åpen, offentlig utrulling. Programmet bygger videre på OpenAIs tidligere begrensede tilgangstilbud, som det livsvitenskaps‑fokuserte GPT‑Rosalind som ble kunngjort 17. april, og speiler Det hvite husets beslutning samme dag om å gi amerikanske etater Anthropic‑modellen Mythos. Ved å begrense AI med frontlinjekapasitet til verifiserte forsvarere, håper OpenAI å fremskynde trusselinformasjon, automatisert hendelsesrespons og sårbarhetsanalyse, samtidig som risikoen for at de samme verktøyene blir brukt som våpen av angripere reduseres. Bransjeobservatører mener lanseringen kan omforme markedet for cyber‑forsvar. Dersom TAC‑modellen viser seg effektiv, kan bedrifter legge press på konkurrenter om å innføre tilsvarende tillitslag, noe som potensielt kan standardisere et nytt nivå av «sikker AI»-tjenester. Samtidig vil regulatorer sannsynligvis granske godkjenningskriteriene, forpliktelsene knyttet til databehandling og ansvarsrammene som følger med slik privilegert tilgang. **Hva som er verdt å følge videre:** OpenAIs utrullingsplan og de konkrete kvalifikasjonskravene for selskaper, offentlige organer og leverandører av administrert sikkerhet; eventuell motstand fra menneskerettighetsgrupper som er bekymret for utransparente tillitsbeslutninger; og om den amerikanske regjeringen vil utvide sine egne AI‑tilgangsprogrammer utover Anthropic til også å omfatte OpenAIs TAC‑pakke. De kommende ukene vil vise om modeller med betrodd tilgang blir den de‑facto kanalen for AI‑drevet cyber‑forsvar, eller om de forblir et nisjetilbud for et begrenset antall.
38

Er datacenterdagens æra på vei til å ta slutt?

Mastodon +6 kilder mastodon
openai
Et innlegg på Brad Delongs Substack har gjenopplivet debatten om hvorvidt massive datasenter‑gårder fortsatt vil være ryggraden i AI. Delong hevder at et håndfull høyt finjusterte modeller som kjører på 50 Mac Mini‑maskiner kan levere nyttig inferens for en brøkdel av en cent per spørring – flere størrelsesordener billigere enn skybaserte tilbud fra OpenAI, Anthropic og deres konkurrenter. Påstanden hviler på nylige fremskritt innen modellkomprimering, kvantisering og optimalisering på enheten som gjør at «små» silisium kan kjøre store språkmodell‑arbeidsbelastninger uten latens‑ og energikostnadene ved eksterne servere. Argumentet er viktig fordi bransjen allerede kjenner på presset fra datasenterutvidelsen. Som vi rapporterte 18. april, fører byggeforsinkelser, skyhøye strømkostnader og en økende tverrpolitisk motstand til at AI‑veksten bremses. Maine innførte den første statlige moratoriet på prosjekter over 20 MW, som skal vare til 2027,
37

Allestedsnærværende musikksignalbehandling, maskinlæring og store språkmodeller

Frontiers +6 kilder 2026-04-15 news
Et nytt forskningsområde med tittelen **«Allestedsnærværende musikksignalbehandling, maskinlæring og store språkmodeller»** er åpnet for innleveringer, og signaliserer et skifte fra rene algoritmiske gjennombrudd til verktøy som tjener musikere, lærere og andre ikke‑tekniske brukere. Kallet, utstedt av tidsskriftets redaksjonsutvalg, bemerker at selv om nylig arbeid har presset grensene for lyd‑språkmodeller – som Music Flamingo‑systemet som kan analysere og generere komplekse musikalske strukturer – forblir de fleste av disse fremskrittene begrenset til laboratorier. Redaktørene argumenterer for at reell adopsjon i praksis stopper opp fordi utviklere sjelden tar tak i latens, tolkbarhet og arbeidsflytrestriksjoner som ikke‑ingeniører møter når de integrerer KI i øvelser, live‑lyd eller klasseromssettinger. Hvorfor dette er viktig nå, er todelt. For det første vokser markedet for KI‑drevet lyd raskt; anslag tyder på at KI‑forsterkede musikkproduksjonsverktøy vil erobre en betydelig andel av det globale DAW‑markedet innen de neste tre årene. For det andre lover sammenslåingen av store språkmodeller (LLM‑er) med signalbehandlings‑pipelines “semantisk” kontroll over klangfarge, arrangement og effekter – men kun dersom disse kontrollene kan uttrykkes i vanlig språk eller intuitive bevegelser. Å bygge bro over dette gapet kan demokratisere høykvalitets musikkproduksjon, senke terskelen for uavhengige artister og åpne nye muligheter for tilgjengelighetsteknologi, som forsterkning av hørselsapparater. Det neste man bør holde øye med, er den første bølgen av artikler som vil dukke opp fra dette temaet. Man kan forvente casestudier som evaluerer LLM‑drevne grensesnitt med levende musikere, benchmark‑tester som måler sanntids‑latens på forbruker‑klassisk maskinvare, samt standardforslag for interoperable KI‑plugins. Hvis fellesskapet leverer brukbare prototyper, kan store DAW‑leverandører og strømmeplattformer begynne å integrere LLM‑støttede assistenter i sine produkter, og omdanne den nåværende forskningshypen til hverdagslige kreative verktøy. Initiativet bygger på momentumet fra nylig AI‑audio‑forskning – mest bemerkelsesverdig Music Flamingo‑modellen og den bredere satsingen på KI‑forsterket beregnings‑audisjon – ved
36

3 timer med Claude Opus 4.7: funksjonell studie‑webapp og fjern‑MCP – én‑gangs‑test

HN +6 kilder hn
anthropicclaudecohere
Claude Opus 4.7 demonstrerte sin langsiktige autonomi i en tre‑timer‑lang live‑test som resulterte i en fullt funksjonell studie‑webapp og et fjernstyrt modell‑kontrollpanel (MCP) uten at noen kode ble skrevet av mennesker. Utvikleren, som arbeidet ut fra kun én enkelt prompt, ba Claude om å designe brukergrensesnittet, generere en Flask‑backend, koble til en PostgreSQL‑database og eksponere et API som kunne kalles fra et eget nettleser‑basert kontrollpanel. Innen minutter leverte modellen et komplett prosjekt‑skjelett, og etter en kort runde med avklarende prompts finjusterte den autentisering, la til paginering og distribuerte hele stakken til en gratis Heroku‑instans. Mot slutten av økten var webappen live, data kunne legges inn, og det fjernstyrte MCP‑et tillot brukeren å justere modellparametere og se token‑bruk i sanntid. Hvorfor dette er viktig er tosidig. For det første bekrefter testen påstandene i Anthropics egne utrullingsnotater om at Opus 4.7 kan håndtere «vanskelige problemer» i flere timer – et sprang fra tidligere modeller som ofte stoppet etter noen hundre tokens. For det andre gjør evnen til å generere ende‑til‑ende produksjonskode at iterasjonsløkken som har begrenset AI‑assistert utvikling til kun kode‑snutter og prototyper, blir forkortet. For oppstartsbedrifter og store foretak som allerede sliter med talentmangel, kan en modell som leverer distribuerbare tjenester på egen hånd, endre ingeniørbudsjetter og akselerere tiden til markedet. Det som bør følges med på videre, er Anthropics kommende integrasjon av Opus 4.7 i Vertex AI og AWS Bedrock, noe som vil gjøre modellen tilgjengelig i stor skala og potensielt senke barrieren på 5–25 USD per million tokens. Samfunnet tester også beste‑praksis‑maler som kombinerer detaljerte planer med såkalte «high‑effort»-prompter, en teknikk som ble fremhevet i vår tidligere analyse av Opus 4.7‑ytelsen 18. april. Oppfølgings‑benchmarker mot Sonnet 4.8 og Mythos 5 vil vise om Opus‑autonomi omsetter seg i konsistent kvalitet på tvers av domener, og om utviklere vil ta den i bruk som en primær kodepartner eller beholde den som en nisje‑assistent.
36

Forklarbare grafnevrale nettverk for overvåkning av interbankkontagion: Et regulatorisk tilpasset rammeverk for den amerikanske banksektoren

ArXiv +5 kilder arxiv
Et team av forskere fra University of Texas og Federal Reserve har publisert en ny pre‑print, «Explainable Graph Neural Networks for Interbank Contagion Surveillance», som introduserer Spatial‑Temporal Graph Attention Network (ST‑GAT). Modellen kombinerer graf‑nevrale‑nettverk‑meldingspassing med tidsmessig oppmerksomhet for å kartlegge det amerikanske interbank utlånsnettet, ved å bruke daglige FDIC Call Report‑data og CAMELS‑indikatorer. Ved å fremheve hvilke motparter og risikofaktorer som driver en økende distress‑score, gir ST‑GAT regulatorer et tidlig varselsystem som både er prediktivt og reviderbart. Kunngjøringen er viktig fordi overvåkning av systemisk risiko lenge har vært avhengig av samlede indikatorer eller ugjennomsiktige maskin‑lærings‑svartbokser som regulatorer har vanskelig for å rettferdiggjøre i henhold til SR 11‑7‑veiledningen. En forklarbar arkitektur gjør det mulig for tilsynsmyndigheter å spore en banks bidrag til kontagion‑veier, og støtter mer målrettede inngrep før en krise sprer seg. Tilnærmingen er også i tråd med den økende etterspørselen etter transparent AI i finans, og svarer på nylige krav om XAI‑standarder i sektoren. Det som nå er å følge med på, er hvor raskt rammeverket går fra akademisk prototype til operativt verktøy. Financial Stability Oversight Council i Federal Reserve har signalisert interesse for pilotprosjekter, og FDIC forventes å teste ST‑GAT mot sin egen stresstest‑pipeline senere i år. Parallelle initiativer i European Central Bank for å integrere graf‑basert risikaanalyse tyder på en bredere regulatorisk endring. Hvis modellen viser seg robust i reelle back‑testing‑scenarioer, kan den omforme makro‑prudentiell overvåkning, få banker til å offentliggjøre mer granulære nettverksdata og sette i gang en ny bølge av forklarbare‑AI‑reguleringer.
35

Mythos og cybersikkerhet – Schneier om Security

Mastodon +6 kilder mastodon
anthropicclaudegpt-5openai
Anthropics Claude Mythos Preview, AI‑modellen som autonomt kan oppdage og utnytte programvarefeil, har gått fra å være en teknisk kuriositet til et brennpunkt i sikkerhetsdebatten, ifølge ledende sikkerhetsanalytiker Bruce Schneier. I et intervju med Schneier on Security advarte han om at «sikkerhetsproblemet er langt større enn ett selskap og én modell», og understreket at Mythos sannsynligvis ikke er et isolert tilfelle. Modellen, som Anthropic har begrenset til omtrent 50 godkjente organisasjoner – inkludert Microsoft, Apple, AWS og CrowdStrike – ble holdt tilbake fra offentlig lansering etter interne tester som viste at den kunne generere zero‑day‑utnyttelser i stor skala. Schneiers bemerkninger gjenspeiler bekymringene som ble reist i vår tidligere dekning av Mythos 18. april, da vi først beskrev Anthropics beslutning om å begrense tilgangen og modellens potensial til å omforme sårbarhetsforskning. Det nye perspektivet er den bredere bransjereaksjonen: OpenAI kunngjorde at deres kommende GPT‑5.4‑Cyber, markedsført som et «farlig» system for sikkerhetsfokuserte oppgaver, også vil bli holdt utenfor offentligheten. OpenAIs foreløpige restriksjon signaliserer at evnen til å våpenføre generativ AI ikke lenger er begrenset til ett enkelt laboratorium. Innsatsen er høy. Hvis kraftige kode‑analyse‑modeller blir allment tilgjengelige, kan den tradisjonelle antakelsen om at det er vanskelig å finne sårbarheter – og dermed en barriere mot masseutnyttelse – forsvinne. En slik endring vil komprimere tidslinjen mellom oppdagelse og våpenisering, og tvinge forsvarere til å stole på automatisert oppdatering og AI‑drevet trusseljakt i stedet for manuell kodegjennomgang. Hva vi bør holde øye med: Anthropic og OpenAI forventes å publisere forskningspapirer med begrenset tilgang som beskriver sikkerhetsmitigasjoner, mens regulatorer i EU og USA sannsynligvis vil samle arbeidsgrupper om AI‑drevet cyberrisiko. Bransjeobservatører vil også følge med på om andre AI‑selskaper følger etter eller forsøker å kommersialisere lignende evner under strengere lisensiering. De neste ukene kan definere både regulatorisk og teknisk spillbok for AI‑drevet cybersikkerhet.
35

Dette er et nytt prosjektmål. Design av en tilpasset og robust tilgjengelig VST‑synth‑modul for Logic Pro på macOS

Mastodon +6 kilder mastodon
ai-safetyappleclaudecopyrightprivacy
En utvikler kunngjorde et nytt åpen‑kilde‑prosjekt for å bygge en skreddersydd, robust og fullt tilgjengelig VST‑synth‑modul for Logic Pro på macOS, med utnyttelse av Claude‑modellen Opus 4.7 for lyd. Initiativet, som ble lagt ut på et offentlig forum 18. april 2026, har som mål å levere en modulær synthesizer som kan styres helt via tastatur, skjermlesere og adaptive grensesnitt, samtidig som den beholder den lav‑latens‑ytelsen som forventes av profesjonelle plugins. Arbeidet bygger direkte på funksjonene som ble demonstrert i Claude‑Opus 4.7, som vi dekket i vårt stykke 18. april om «Claude Design, Opus 4.7 Regression, GPT‑5.3 & KIMI K2 Benchmarks». Opus 4.7 kan generere produksjonsklar DSP‑kode og brukergrensesnitt‑layout fra naturlige språk‑prompt, noe som dramatisk forkorter utviklingssyklusen for komplekse lydverktøy. Ved å kanalisere denne kraften inn i en VST som kjører native i Logic Pro, lover prosjektet å senke den tekniske terskelen for musikere som er avhengige av Apples flaggskip‑DAW, spesielt de med syns‑ eller motoriske funksjonsnedsettelser som lenge har slitt med ugjennomsiktige plugin‑grensesnitt. Dette er viktig fordi VST‑synthesizere dominerer moderne elektronisk musikkproduksjon, men tilgjengelighet ofte er en ettertanke. En synth som oppfyller WCAG‑AA‑standardene kan sette en ny målestokk og oppmuntre andre utviklere til å innlemme lignende funksjoner fra starten av. Videre viser prosjektet hvordan store språkmodeller kan utnyttes til sanntids‑lydteknikk, og peker mot en fremtid hvor AI‑genererte plugins blir like vanlige som AI‑assisterte mastering‑tjenester. Se etter en betaversjon planlagt til Q3 2026, etterfulgt av ytelses‑benchmarking mot eksisterende gratis‑synths som Synplant 2 og Pendulate. Utvikleren planlegger å integrere GitHubs llmfit‑verktøykjede for å sikre at koden kjører effektivt på Apple Silicon, og samtaler er allerede i gang med Apples tilgjengelighetsteam om mulig inkludering i Logic Pro‑plugin‑markedet. Fellesskapets respons vil vise om AI‑drevet, inkluderende synth‑design kan bli en mainstream‑praksis.
35

Apple har lansert disse 12 nye produktene i år

Mastodon +6 kilder mastodon
apple
Apple har bekreftet at 12 nye enheter ble rullet ut i sin portefølje i 2026, en sum som overgår selskapets vanlige årlige takt og understreker et press for å sementere sin ledelse innen maskinvare‑drevet AI. Utvalget, detaljert i en MacRumors‑oppsummering, inkluderer iPhone 16 Pro og iPhone 16, en oppdatert iPhone SE 4, iPad Pro drevet av den nye M4‑brikken, en iPad Air med oppgradert M2‑Plus‑prosessor, MacBook Air og 14‑tommers MacBook Pro‑modeller som også har M4‑silisium, Apple Watch Series 10 med avanserte helsesensorer, en andre generasjon HomePod mini, Vision Pro 2 mixed‑reality‑headset, tredje generasjon AirPods Pro, og en oppdatert Apple TV 4K. Omfanget av lanseringene er viktig av tre grunner. For det første signaliserer den samtidige lanseringen av flere M4‑baserte enheter Apples tillit til at deres neste generasjonsbrikke kan håndtere de tunge AI‑arbeidsbelastningene utviklere allerede krever, fra store språkmodeller på enheten til sanntids‑bildebehandling. For det andre viser det utvidede Vision Pro‑økosystemet og tillegget av AI‑forsterkede helsetjenester på Watch Apples strategi om å veve intelligens inn i hverdagslige tilbehør, og skape nye inntektsstrømmer utover iPhone. For det tredje legger den enorme mengden produkter press på konkurrenter som Samsung og Google, som må akselerere sine egne AI‑sentrerte veikart for å forbli konkurransedyktige i premium‑segmentet. Fremover vil neste store milepæl være Apples WWDC 2026, hvor selskapet forventes å avduke macOS 15, en dypere integrasjon av LLM‑modeller på enheten, og muligens en prototype av en foldbar iPhone – et konsept vi tidligere har flagget i vår dekning av Apples eksperimentelle maskinvare. Investorer og utviklere bør også holde øye med programvareoppdateringer som låser opp de nye M4‑mulighetene, samt eventuelle overraskende tjenester som kan kommersialisere AI‑funksjonene som er innebygd i maskinvaren.
35

Topphistorier: ‘iPhone Ultra’-rykter, mangel på Mac mini og Mac Studio, og mer

Mastodon +6 kilder mastodon
apple
Apples forsyningskjede sender blandede signaler denne uken. selskapets amerikanske nettbutikk har blitt helt utsolgt på flere høy‑end‑konfigurasjoner av Mac mini og Mac Studio, mens ferske samtaler på kinesiske forum og analytiker‑briefinger peker mot en kommende «iPhone Ultra» som kan ligge over dagens Pro‑linje. Utsalget, som først ble oppdaget på Apples nettside torsdag, påvirker topp‑modellen av Mac mini med M5 Pro‑brikken og Mac Studio‑modellene som kombinerer M5 Ultra med 64 GB RAM. Apple har sluttet å godta bestillinger på disse SKU‑ene, noe som får brukere til å stå på ventelister eller lete etter renoverte enheter. Bransjeobservatører knytter mangelen til en forestående oppdatering: rykter antyder at Apple vil avduke neste generasjons M5‑baserte Mac‑maskiner senere i år, og det nåværende lageret ryddes før lanseringen. Samtidig har betegnelsen «iPhone Ultra» dukket opp igjen i lekkasjesirkler. Et sett med interne dokumenter innhentet av MacRumors antyder en større iPhone med en 6,9‑tommers LTPO‑skjerm, et per‑pixel sensor‑shift‑optisk bildestabilisasjonssystem og en ny ramme i titan. Enheten skal angivelig leveres med den kommende A18X‑brikken og et lagringsalternativ på 1 TB som basis, og posisjoneres som et premium‑alternativ til Pro Max. Som vi rapporterte 18. april om muligheten for en foldbar iPhone, markerer Ultra‑ryktet Apples fortsatte satsing på å utvide flaggskip‑segmentet. Hvorfor dette er viktig, er tosidig. For profesjonelle kan mangelen på Mac mini og Mac Studio forsinke kritiske arbeidsflyter som er avhengige av Apple‑silisiums ytelse, mens iPhone Ultra kan omforme markedet for high‑end‑smarttelefoner og sette nye forventninger til kamera‑ og batterikapasitet. Hva du bør følge med på videre: Apples forsyningskjede‑briefinger i de kommende ukene, eventuelle offisielle uttalelser om Mac‑oppdateringen, og en potensiell produktavduking på WWDC i september, hvor iPhone Ultra endelig kan bli bekreftet.
35

En måned med MacBook Neo og kjenner grensene

Mastodon +6 kilder mastodon
applechips
Apples nyeste bærbare, MacBook Neo, har tilbrakt sin første måned i hendene på en senioringeniør som byttet sin M3‑drevne MacBook Air med den 13‑tommers modellen basert på A18 Pro. Anmelderens konklusjon, publisert på CNET, roser Neos slanke chassis, livlige Liquid Retina‑skjerm og løftet om «Apple Intelligence» integrert i chipen, men påpeker en eneste, tydelig mangel: de 8 GB med samlet minne i grunnkonfigurasjonen blir raskt en flaskehals for hverdagslige AI‑tunge arbeidsflyter. I løpet av testen kjørte forfatteren en blanding av nett‑sentrerte oppgaver, lokal LLM‑inferens via Claude Opus 4.7, og en typisk Safari‑økt med mange faner. Minnepresset skjøt i været så snart et eneste Claude‑drevet kodefullføringsvindu ble åpnet, noe som tvang systemet til å bytte til swap og førte til merkbar forsinkelse. Selv vanlig multitasking – e‑post, dokumentredigering og en bakgrunnsintegrasjon mellom GitKraken og Claude – overskred Neos RAM‑ramme, i strid med Apples markedsføring som hevder at enheten er «bygget for AI». Begrensningene er viktige fordi Apple pos
35

India vil ikke kreve at Apple forhåndsinstallerer statlig ID‑app på iPhone

Mastodon +6 kilder mastodon
applegoogle
Apple har trukket seg fra en statlig pålagt forhåndsinstallasjon av Indias digitale ID‑app Sanchar Saathi på iPhone‑telefoner som selges i landet. Beslutningen kommer etter en uke med opphetet debatt etter at Ministeriet for elektronikk og informasjonsteknologi beordret alle smarttelefonprodusenter, inkludert Apple, til å integrere den statseide appen som en ikke‑fjernbar systemkomponent. Apple advarte om at kravet ville komme i konflikt med iOS‑sikkerhetsmodellen og prinsippene om bruker­valg, og signaliserte at de ville utfordre pålegget i retten. Omveltningen har betydning på flere områder. For India er Sanchar Saathi‑appen en hjørnestein i regjeringens satsing på å digitalisere identitetsbekreftelse, velferdsutdeling og mobilnettverkssikkerhet. Å kreve den på hver enhet ville ha fremskyndet adopsjonen, men også vekket bekymring for personvern, overvåkning og svekkelse av brukernes autonomi. Forbrukergrupper og personvernforkjempere samlet seg på sosiale medier og argumenterte for at en obligatorisk, uutslettelig app kunne bli en bakdør for statlig overvåkning. Apples motstand understreker den bredere spenningen mellom globale teknologiselskaper og nasjonale regulatorer som ønsker strengere kontroll over programvareøkosystemer. Beslutningen bevarer også Apples posisjon i Indias raskt voksende smarttelefonmarked, hvor selskapet dominerer premium‑segmentet, men møter hard konkurranse fra Android‑produsenter som allerede har etterkommet pålegget. Ved å unngå en juridisk konfrontasjon unngår Apple potensielle forstyrrelser i forsyningskjeden og en PR‑krise som kunne ha skadet merkevaren. Hva som skjer videre: Indiske myndigheter kan vurdere mykere tilnærminger, som å stimulere til frivillige nedlastinger eller integrere tjenesten via App Store. Apple forventes å levere et formelt svar som beskriver deres politiske innvendinger, noe som kan sette presedens for fremtidige statlige pålagte apper i andre jurisdiksjoner. Observatører vil også følge med på om saken fører til lovgivningsmessige justeringer av Indias digitale ID‑rammeverk eller utløser lignende tvister i markeder som Brasil og Indonesia.
35

Citadels sjef for personalavdelingen forlater firmaet mens hedgefond kjemper om talent

Mastodon +6 kilder mastodon
apple
Citadels sjef for personalavdelingen, Sjoerd Gehring, har forlatt det $67 milliarder store hedgefondet etter mindre enn to år i stillingen, rapporterte Business Insider 17. april. Gehring, som kom til Citadel fra Apple sent i 2024 etter seniorroller i Johnson & Johnson og Accenture, fikk i oppdrag å skalere firmaets talentpipeline ettersom konkurransen om kvantitative tradere, datavitere og AI‑spesialister har intensifisert seg på Wall Street. Avgangen understreker en bredere talentknapphet som omformer hedgefondbransjen. Etter hvert som firmaer investerer milliarder i proprietære handelsmodeller og generativ‑AI‑verktøy, har mangelen på ingeniører som kan bygge bro mellom finans og maskinlæring gjort rekrutterere til høyt profilerte og høyt betalte aktører. Citadel, som har utvidet spesialiserte rekrutteringsteam og aktivt søker teknologitalent, står nå i fare for å miste moment i sine AI‑drevne strategier uten en senior HR‑leder som kan styre ansettelse, fastholdelse og kulturinitiativer. Det som følger vil vise hvordan Citadel og konkurrentene tilpasser seg. Observatører vil følge med på om firmaet utnevner en etterfølger med dypere AI‑rekrutteringskompetanse eller om de går over til en desentralisert ansettelsesmodell som utnytter eksterne talentbyråer. Beslutningen reiser også spørsmål om bærekraften i «rekrutterer‑som‑stjerne»-modellen; dersom topp‑HR‑talent fortsetter å hoppe mellom firmaer, kan hedgefond måtte revurdere kompensasjonsstrukturer og karriereveier for ledere innen people‑operations. Interessenter bør holde øye med Citadels neste kunngjøring om ansettelser, eventuelle endringer i planene for utvidelse av AI‑teamet, samt om andre store fond—som Bridgewater, Two Sigma og Renaissance—kunngjør tilsvarende lederendringer. Resultatet vil signalisere hvordan bransjen balanserer kappløpet om banebrytende AI‑talent mot volatiliteten i ledelsesutskiftninger på seniornivå.
35

AirPods Pro 3 er nå $50 billigere, nesten på sin laveste pris noensinne

Mastodon +6 kilder mastodon
apple
Apple har kuttet prisen på sine AirPods Pro i tredje generasjon med $50, og bringer de flaggskip‑øreproppene ned til litt under $200 i de fleste markeder. Rabatten, som ble kunngjort på The Verge og gjentatt av flere europeiske forhandlere, tilsvarer den laveste prisen modellen har hatt siden lanseringen sent i 2023. Kuttet kommer mens Apple forbereder seg på neste bølge av bærbare enheter. Analytikere forventer at AirPods 4, som ryktes å ha en ny driverarkitektur og dypere integrasjon med Vision Pro, vil komme senere i år. Ved å senke kostnaden for den nåværende generasjonen kan Apple tømme lageret samtidig som de holder AirPods‑serien attraktiv for prisfølsomme kjøpere, spesielt i Norden hvor premium‑lydprodukter konkurrerer med lokalt populære merker som Jabra og Sony. For forbrukerne betyr avtalen tilgang til Pro‑ens kjennetegnende funksjoner – aktiv støydemping, romlyd med dynamisk hodesporing og et sømløst H1‑brikkedrevet økosystem – til en pris som kan måle seg med mellomklasse‑konkurrentene. Tidlige adoptere som gikk glipp av den første lanseringsrabatten har nå en levedyktig oppgraderingsvei fra eldre AirPods eller fra konkurrerende ekte trådløse ørepropper. Prisendringen signaliserer også Apples bredere strategi med å bruke midlertidige prisnedsettelser for å opprettholde salgsmomentum mellom produktsykluser. Observatører vil følge med på om rabatten fører til en merkbar økning i enhetsleveranser i den før‑ferieperioden, og hvordan den påvirker prisene på kommende modeller. De neste ukene vil avsløre om Apple forlenger kampanjen, introduserer pakkel
35

OpenAI (@OpenAI) på X

Mastodon +6 kilder mastodon
openai
OpenAI har tatt sitt første steg inn i biomedisin et skritt videre, og avduket en detaljert gjennomgang av «Life Sciences»-modellserien den introduserte forrige uke. I et halvtime langt program av OpenAI‑podcast forklarte forskningsleder Joy Jiao og produktansvarlig Yunyun Wang hvordan modellene er konstruert for biologi, legemiddelforskning og translational medisin, og beskrev konkrete bruksområder fra proteinstruktur‑prediksjon til hypotese‑generering for nye terapeutika. Diskusjonen bygger på den begrensede‑tilgang‑GPT‑Rosalind‑modellen kunngjort 17. april, som markerte OpenAIs første offentlige tilbud av en stor språkmodell finjustert for livsvitenskapelige arbeidsbelastninger. Ved å utdype veikartet signaliserer selskapet at serien går fra prototype‑stadiet mot bredere tilgjengelighet for akademiske laboratorier og farmasøytiske partnere. Hvorfor dette er viktig er todelt. For det første har biotek‑sektoren lenge vært avhengig av spesialiserte verktøy som DeepMinds AlphaFold; en allsidig LLM som kan tolke vitenskapelig litteratur, foreslå eksperimentelle design og utforme regulatoriske dokumenter, kan komprimere år med forskning til måneder. For det andre intensiverer OpenAIs inntog konkurransen om AI‑drevede legemiddelpipelines, noe som potensielt kan omforme finansieringsstrømmer og tvinge regulatorer til å håndtere AI‑genererte påstander. Det som bør følges med på videre er utrullingsmekanikkene. OpenAI har antydet en lagdelt tilgangsmodell som vil kombinere API‑endepunkter med sikkerhetslag, og podkasten nevnte kommende samarbeid med store farmasøytiske selskaper for å pilotere teknologien på virkelige pipelines. Ytelses‑benchmarker, spesielt på oppgaver som de‑novo‑molekyl‑design, vil bli gransket av både investorer og det vitenskapelige fellesskapet. En formell lanseringsdato, prisstruktur og eventuelle partnerskapskunngjøringer vil sannsynligvis komme i løpet av de kommende ukene, og vil sette tempoet for AI‑ens rolle i neste bølge av medisinske gjennombrudd.
35

Gökdeniz Gülmez (@ActuallyIsaak) på X

Mastodon +6 kilder mastodon
applebenchmarks
Apple har introdusert MLX‑Benchmark Suite, den første omfattende benchmarken designet for å evaluere ytelsen til store språkmodeller (LLM) på sitt åpne kildekode‑rammeverk MLX. Kunngjort av ML‑forsker Gökdeniz Gülmez på X, samler pakken et kommandolinje‑grensesnitt og et kuratert datasett som tester en modells evne til å forstå, generere og feilsøke kode. Ved å automatisere disse kjerneoppgavene for utviklere gir verktøyet ingeniører en konkret måte å sammenligne hvordan ulike LLM‑er kjører på Apple‑silicon og å finjustere inferens‑pipelines. Utgivelsen er viktig fordi Apples MLX‑rammeverk, lansert tidligere i år, lover høy gjennomstrømning og lav latens for AI‑arbeidsbelastninger på selskapets M‑serie‑brikker. Fram til nå har utviklere manglet en standardisert målestokk for å måle LLM‑effektivitet og nøyaktighet innen dette økosystemet. Benchmarken fyller dette gapet, og tilbyr en reproduserbar basislinje som kan akselerere adopsjonen av Apple‑sentraliserte AI‑løsninger og informere beslutninger om maskinvare‑programvare‑samskaping. Dens åpne kildekode‑natur inviterer også til bidrag fra fellesskapet, og kan potensielt gjøre pakken til en de‑facto referanse for det bredere AI‑på‑Apple‑markedet. Ser man fremover, vil fellesskapet følge med på de første publiserte resultatene, som bør avdekke hvordan Apples egne modeller presterer i forhold til åpne alternativer som LLaMA eller Falcon når de kjøres på M‑serie‑GPU‑er. Apple kan integrere benchmarken i sin utviklerportal, og gjøre ytelses‑dashboards offentlig tilgjengelige. Videre oppdateringer kan inkludere utvidede oppgavekategorier—bortenfor kode—som dekker naturlig språk‑resonnement, samt tettere integrasjon med Xcodes profileringsverktøy. Benchmarkens utvikling vil sannsynligvis forme de konkurrerende dynamikkene mellom Apples ML‑stack og andre maskinvare‑agnostiske rammeverk som PyTorch og TensorFlow.
35

En Apple‑leder som gikk av etter 31 år delte den nostalgiske sjekklisten fra sin siste dag

Mastodon +6 kilder mastodon
apple
Apple sin langvarige produkt‑markedsføringssjef Stan Ng har offisielt trådt tilbake etter en 31‑årsperiode som spenner over lanseringen av iPod, iPhone, Apple Watch og AirPods. I et LinkedIn‑innlegg som raskt ble viralt, publiserte Ng en «nostalgisk sjekkliste» over ritualene han fullførte på sin siste dag i Apple Park, fra å se soloppgangen over campus til å ta en ensom sykkeltur rundt den sirkulære ringen som omkranser hovedkvarteret. Listen inneholdt også en rask gjennomgang av innboksen, en siste spasertur gjennom designstudioene der Apple Watch og AirPods først ble skisset, og en symbolsk «sign‑off» på markedsførings‑deckene for den kommende produkt‑syklusen. Pensjoneringen markerer avgangen til en av de få lederne som har hatt ansvar for Apples forbruker‑hardware‑markedsføring gjennom tre produktgenerasjoner. Ng sin avgang kommer i en periode der selskapet akselererer sin satsing på helseteknologi, utvidet virkelighet og AI‑drevet tjenester – områder som nå vil bli ledet av en yngre gruppe ledere. Analytikere ser hans avgang som en litmus‑test på hvor smidig Apple kan overføre sin merkevare‑fortelling uten den stabile hånd som bidro til å forme de ikoniske kampanjene «Shot on iPhone» og «Feel the Beat». Bransjeobservatører vil følge nøye med på hvem Apple utnevner til å fylle den ledige VP‑stillingen, og om den nye lederen vil legge større vekt på generativ‑AI‑verktøy i kampanjekreasjon – en trend Ng hintet til ved å nevne at han brukte en LLM til å utforme deler av sin avskjedshilsen. Flyttingen reiser også spørsmål om talent‑bevaring i Silicon Valleys aldrende lederstabel, spesielt ettersom konkurrenter som Google og Microsoft satser hardt på AI‑sentrisk markedsføring. De kommende ukene vil avdekke Apples etterfølgerplan og signalisere hvordan selskapet har tenkt å holde sin produkt‑historiefortelling frisk i et stadig mer AI‑drevet marked.
32

En av fordelene med #LLM og #genAI som blir drevet fremover overalt er at det virkelig bringer

Mastodon +6 kilder mastodon
multimodal
Et oppsving i åpen‑kilde‑aktivitet rundt store språkmodeller (LLM‑er) og generativ AI (GenAI) har boblet opp på utviklerforum og i sosiale medier, med mange bidragsytere som sier at hypen “avslører den sanne naturen til mange FLOSS‑utviklere.” Kommentaren kommer i kjølvannet av en bølge av høyprofilerte utgivelser – Metas Llama 2, Mistral 7B og det fellesskapsdrevne verktøyet «llmfit» som kartlegger modeller til lokal maskinvare – som har senket terskelen for hvem som helst til å kjøre, fin‑tune eller distribuere en kraftig transformer på en laptop eller en beskjeden server. Hvorfor dette er viktig er todelt. For det første gjør flommen av kode, benchmark‑resultater og modell‑forks åpen‑kilde‑økosystemet til et raskt prototypelaboratorium for neste generasjon AI‑tjenester, og akselererer innovasjon langt raskere enn tradisjonelle bedrifts‑FoU‑sykluser. For det andre eksponerer den samme åpenheten divergerende holdninger: mens mange utviklere feirer demokratiseringen av AI, uttrykker andre frustrasjon over lisenskonflikter, bærekraftskostnader og hvor lett ondsinnede aktører kan omforme modellene. Som vi rapporterte 18. april 2026 i vår dekning av «llmfit»-depotet, har evnen til å matche modeller til maskinvare allerede utløst et kappløp blant oppstartsbedrifter og hobbyister om å sette opp produksjons‑klare API‑er uten å kjøpe sky‑kreditter. Når vi ser fremover, vil fellesskapets momentum sannsynligvis forme tre nøkkelområder. Den nordiske regionen, med sin sterke åpen‑kilde‑arv, kan få nye offentlig finansierte prosjekter som integrerer personvern‑by‑design‑prinsipper i LLM‑pipelines. Selskaper vil følge med på om FLOSS‑bølgen tvinger dem til å åpne kildekoden til deler av sine egne stacker eller til å innføre strengere adgangskontroll. Til slutt forventes regulatorer i EU og Sverige å utforme veiledning om åpen‑kilde‑AI‑lisensiering og risikovurdering, et tiltak som enten kan sementere sektorens troverdighet eller pålegge nye samsvarshindringer. De neste månedene vil vise om oppsvinget i åpen kilde blir en varig søyle i GenAI‑landskapet eller en kortvarig hype‑blåst.
32

Kunstig intelligens har et meldingsproblem av egen opphav

Mastodon +6 kilder mastodon
anthropicdeepmindgoogle
AI‑selskaper står overfor en ny type motstand: måten modellene deres snakker til brukerne på. Etter en bølge av kritikk som påpeker at chat‑boter ofte gir altfor forsiktige, unnvikende eller til og med nedlatende svar, vender selskapene seg nå til filosofer og geistlige for å omskrive «stemmen» i produktene sine. Google DeepMind kunngjorde i forrige uke at de har ansatt en intern filosof for å revidere språket i sine nyeste modeller – et trekk som speiler Anthropics nylige beslutning om å samle en gruppe kristne ledere for å vurdere den moralske tonen i deres chat‑grensesnitt. Skiftet kommer i kjølvannet av økende uro blant regulatorer, forbrukerorganisasjoner og etikere som argumenterer for at AI‑genererte meldinger kan påvirke meninger på subtile måter, forsterke fordommer eller skyve ansvaret bort. Ved å bringe akademiske og religiøse perspektiver inn i utviklingsprosessen, håper selskapene å lage svar som er transparente, respektfulle og i tråd med bredere samfunnsverdier. DeepMinds filosof, Dr. Mira Patel, skal samarbeide med ingeniører for å flagge formuleringer som kan oppfattes som paternalistiske eller misvisende, mens Anthropic‑s interreligiøse verksted har produsert et sett med retningslinjer for håndtering av temaer som tro, dødelighet og personlig rådgivning. Hvorfor dette er viktig er todelt. For det første er meldingsutvekslingen den mest synlige grensesnittet mellom AI og publikum; feil kan undergrave tilliten raskere enn tekniske feil. For det andre signaliserer initiativet en bredere bransjetrend med å institusjonalisere etisk tilsyn, som svar på nylige skandaler rundt «nudify»-apper og uutprøvd selv‑forbedrende kode som har tiltrukket seg oppmerksomhet fra EU‑regulatorer. Det neste å holde øye med er de konkrete resultatene av disse eksperimentene. Begge selskapene har lovet å publisere «meldingsrevisjoner» senere i år, og Europakommisjonen forventes å utforme en frivillig atferdskode for AI‑kommunikasjon. Hvis de nye retningslinjene viser seg effektive, kan de bli en mal for sektoren, og få andre aktører – fra oppstarts‑chat‑tjenester til etablerte teknologigiganter – til å integrere filosofer, teologer eller etikere i sine produktlinjer. De kommende månedene vil vise om en mer reflektert tone kan gjenopprette tilliten eller bare legge til et ekstra lag med bedrifts‑posturing.
32

Microsoft Surface‑prishopp fører til minnemangel: Hvilken stor leverandør av lagrings‑brikker—SK Hynix, Micron eller SanDisk—gir best investeringsverdi?

Mastodon +6 kilder mastodon
agentschipscopilotmicrosoft
Microsoft har hevet prisene på sin Surface‑serie, og lagt til 100 – 500 USD på de fleste modellene mens bransjen sliter med en ny RAM‑mangel. Prisøkningen, som er bekreftet av Microsofts egne nettbutikk‑oppføringer og rapportert av Windows Central, gjenspeiler de stigende kostnadene for DRAM‑ og NAND‑brikker som har blitt presset av etterspørselsboomer i pandemiperioden, flaskehalser i forsyningskjeden og en økning i AI‑drevne datasentre. Ved å overføre de høyere komponentkostnadene på forbrukerne signaliserer Microsoft at mangelen ikke lenger er en midlertidig glipp, men en strukturell begrensning som påvirker premium‑PC‑markedet. Dette treffer mer enn bare laptop‑segmentet og kaster de tre største minnebrikkprodusentene—SK Hynix, Micron og SanDisk (Western Digital‑s NAND‑avdeling)—inn i investeringsspotlightet. SK Hynix, verdens nest største DRAM‑leverandør, drar nytte av sitt aggressive kapasitetsutvidelsesprogram i Sør‑Korea, som har som mål å legge til over 300 GB per sekund med ny produksjon innen 2027. Micron, den eneste amerikanske DRAM‑produsenten, har kjempet for å øke sin 3‑D‑stablede teknologi, men inntjeningen forblir volatil på grunn av svingende etterspørsel fra både forbruker‑PC‑er og bedrifts‑AI‑arbeidsbelastninger. SanDisk, selv om den primært er en NAND‑spiller, nyter en diversifisert portefølje som inkluderer solid‑state‑drives for datasenter‑servere, et segment som vokser ettersom generative‑AI‑modeller krever stadig mer lagringskapasitet. Investorer bør følge kvartalsresultatene for ledetråder om hvordan hvert selskap balanserer lagerbeholdningen mot den vedvarende chip‑overskuddet, samt kunngjøringer om ny fabrikk‑kapasitet eller joint ventures som kan tippe den konkurranse­messige balansen. En ytterligere prisjustering fra Microsoft, eller et skifte mot alternativ silisium som LPDDR5X, vil teste etterspørselselastisiteten og kan omforme inntektsutsiktene for de tre produsentene. Den kommende inntjeningssesongen, planlagt til tidlig Q3, vil sannsynligvis avsløre hvilken chipprodusent som er best posisjonert til å tjene på den pågående minnemangelen.
32

fly51fly (@fly51fly) på X

Mastodon +6 kilder mastodon
Den kinesiske AI‑forskeren og BUPT‑professoren fly51fly kunngjorde en ny tilnærming for å utvide store språkmodellers (LLM‑ers) evne til å håndtere svært lange innspill. I et innlegg på X introduserte han «Shuffle the Context», en selv‑destillasjonsteknikk som justerer den populære Rotary Positional Embedding (RoPE) for bedre å bevare informasjon over utvidede token‑vinduer. Ved å tilfeldig permutere segmenter av konteksten under en lærer‑student‑treningssløyfe, tvinger metoden modellen til å lære posisjonsagnostiske representasjoner samtidig som den respekterer rekkefølgen, noe som gjør at den kan beholde sammenheng over titusenvis av token. Dette gjennombruddet er viktig fordi håndtering av lange kontekster fortsatt er en sentral flaskehals for LLM‑er som brukes i virkelige applikasjoner
32

scythe@八方塞がり (@keiyotokei) på X

Mastodon +6 kilder mastodon
gpt-5openai
OpenAI har lansert GPT‑5.4‑Pro, en ny høyytelses stor språkmodell som tilbys til en basispris på 100 USD per måned. Kunngjøringen, publisert av X‑bruker @keiyotokei, signaliserer selskapets satsing på å gjøre sine mest kapable modeller økonomisk mer tilgjengelige etter en periode med kun premium‑priser for bedriftskunder. Dette trekket er viktig fordi det reduserer gapet mellom banebrytende kunstig intelligens og budsjettene til små bedrifter, forskningslabber og til og med avanserte hobbyister. Inntil nå har de kraftigste versjonene av OpenAIs modeller – som GPT‑4 Turbo – i praksis vært låst bak bruksbaserte API‑avgifter eller kostbare bedriftskontrakter. En fast pris på 100 USD gjør en “pro‑grad” modell innen rekkevidde for mange nordiske oppstartsbedrifter som har vært tvunget til å bruke eldre versjoner eller konkurrerende tjenester fra Anthropic og Google Gemini. For utviklere forenkler den forutsigbare kostnadsstrukturen budsjetteringen for produkter som krever konsistente, lav‑latens svar, mens lærere kan eksperimentere med avanserte prompt‑teknikker uten å bekymre seg for uventet høye regninger. Prisendringen antyder også en bredere markedsstrategi. Ved å utvide brukerbasen for sin flaggskip‑modell kan OpenAI samle rikere bruksdata, finjustere sikkerhetskontroller og styrke sin posisjon mot konkurrenter som samtidig senker sine egne inngangspriser. Det nordiske AI‑økosystemet – allerede livlig med offentlige pilotprosjekter og universitets‑spin‑offs – kan oppleve en bølge av prototype‑utrullinger, fra automatisert kundeservice til sanntids‑oversettelsesverktøy tilpasset regionens flerspråklige markeder. Det som skal følges med i neste fase er om OpenAI vil innføre lagdelte grenser for token‑gjennomstrømning, legge til bedrifts‑funksjoner som dedikerte instanser, eller rulle ut et “pay‑as‑you‑go”‑tillegg for tunge brukere. Like viktig vil være responsen fra konkurrentene: en priskrig kan akselerere spredningen av kraftige LLM‑er over hele Europa, mens regulatorisk gransking av modelltilgjengelighet og databehandling kan forme hvor raskt disse tjenestene kan tas i bruk. De kommende ukene bør avdekke om GPT‑5.4‑Pro‑s beskjedne prislapp omsettes til en målbar økning i AI‑drevet innovasjon i Norden.
32

Den gangen var SKYEN den ene store greia. Nå kaller noen som meg det bare andres datamaskiner

Mastodon +6 kilder mastodon
En bølge av kommentarer på sosiale medier begynner allerede å omformulere store språkmodeller (LLM‑er) i dagligtale som minner om hvordan «skyen» ble avmystifisert for et tiår siden. Et innlegg som gikk viralt på X tirsdag, liknet dagens AI‑hype med den tidlige sky‑æraen, og bemerket at «skyen var denne ene store greia. Nå kaller noen som meg det bare andres datamaskiner». Forfatteren spurte deretter hvordan vi vil gi LLM‑ene et nytt navn når oppstyret roer seg, og foreslo det samlede begrepet «statistisk sannsynlighets‑prediktor». Observasjonen treffer en økende stemning blant teknikere og markedsførere om at den glansfulle merkevarebyggingen av AI begynner å bli slitt. Da «cloud computing» ble et buzzword tidlig på 2010‑tallet, gikk leverandørene etter hvert over til mer funksjonelle betegnelser – SaaS, IaaS, PaaS – som reflekterte den underliggende tjenestemodellen. Analytikere advarer nå om at en lignende ommerkning kan være nært forestående for generativ AI, spesielt ettersom virksomheter sliter med kostnader, pålitelighet og regulatorisk granskning. Hvorfor dette er viktig, er todelt. For det første former terminologi offentlig oppfatning og politikk; et skifte fra «AI» til et mer teknisk uttrykk kan dempe frykt‑spredning som driver frem krav om tung regulering. For det andre kan det påvirke produktposisjonering: leverandører som adopterer en beskjeden betegnelse kan vinne troverdighet hos risikovillige kunder, mens de som holder fast ved hype risikerer motreaksjoner. Trenden speiler også interne endringer i ledende forskningslabber, hvor nylige avgang av seniorpersonell i OpenAI understreker en bevegelse bort fra spekulative prosjekter mot mer pragmatiske tilbud. Det neste å holde øye med er de første konkrete adopsjonene av alternative navn i pressemeldinger, utviklerdokumentasjon og bedrifts‑veikart. Dersom store sky‑leverandører eller AI‑plattformeiere begynner å beskrive modellene sine som «sannsynlighetsmotorer» eller «prediktive teksttjenester», vil det språklige skiftet sannsynligvis bli sementert som en bransjestandard, og omforme hvordan neste generasjon av generative verktøy selges, reguleres og forstås.
29

Forrige uke deltok jeg på et kurs om # IREB. Neste uke vil jeg ta sertifiseringseksamen

Mastodon +6 kilder mastodon
googletraining
En programvareingeniør som nylig fullførte et IREB Foundation Level‑kurs, vendte seg til Googles Notebook LM for å omgjøre den 180‑siders offisielle pensumen til et sett med øvingsspørsmål og flash‑kort. Den AI‑drevne notatboken analyserte det tette materialet om krav‑engineering, genererte flervalgsspørsmål og kort for spaced‑repetition, og leverte dem i et format kandidaten kunne gå gjennom på en laptop eller telefon. Det selvlagde studiematerialet, sier ingeniøren, «er virkelig bra og hjelper» i de siste ukene før den overvåkede, tidsavgrensede CPRE‑FL‑eksamenen administrert av iSQI. Eksperimentet belyser en voksende trend i det nordiske teknologimiljøet: å utnytte generativ AI for å effektivisere forberedelser til profesjonelle sertifiseringer. Tradisjonelle kurs fra leverandører som IREB‑CPRE, ISTQB og Agile‑trenere baserer seg ofte på statiske lysbildefremvisninger og trykte arbeidsbøker, noe som kan være tidkrevende å fordøye. Notebook LMs evne til å trekke ut nøkkelbegreper, formulere plausible distraktorer og organisere dem i adaptive quizer reduserer forberedelsestiden og kan øke beståelsesraten, spesielt for travle utviklere som balanserer prosjektarbeid. Bransjeobservatører påpeker at sertifiseringsorganer ennå ikke har formalisert regler for AI‑assisterte studieverktøy, men IREB‑styret har uttrykt interesse for hvordan digitale verktøy påvirker kandidatens prestasjon. Dersom AI‑generert innhold viser seg pålitelig, kan opplæringsfirmaer integrere lignende funksjoner i sine plattformer og tilby personaliserte læringsløp i stor skala. Samtidig kan eksamensadministratorer stramme inn tilsynsprotokoller for å beskytte mot utilsiktet lekkasje av AI‑utformede spørsmål. Hold øye med kunngjøringer fra IREB og iSQI i de kommende månedene om oppdateringer av retningslinjer for AI‑støttet forberedelse. I mellomtiden markedsfører opplæringsselskaper som Trendig og Serview allerede AI‑forsterkede moduler, noe som tyder på at neste bølge av krav‑engineering‑utdanning vil bli formet like mye av maskinlæring som av menneskelig ekspertise.
29

Opus 4.7 er ikke en enkel oppgradering. Anthropic la til ekte funksjoner: ekstremt høy innsats, adaptiv tenkning, oppgave‑budsjett

Mastodon +6 kilder mastodon
anthropicbenchmarksclaude
Anthropic rullet ut Claude Opus 4.7 den 16. april og presenterte den som en «virkelighetsnær oppgradering» snarere enn en mindre feilretting. Den nye modellen introduserer et høyt‑innsats resonneringsnivå, adaptiv‑tenkning‑prompt, kontroll av oppgave‑budsjett og en dramatisk visuell forbedring som tredobler bildeforståelsen og løfter visuell skarphet til 98,5 prosent. Samtidig brøt utgivelsen API‑kompatibiliteten, byttet tokenisereren til en som øker token‑antallet med opptil 35 prosent, og utløste en rask motreaksjon som tvang Anthropic til å heve takhastighetene for alle brukere. Som vi rapporterte den 18. april i vår «Claude Opus 4.7 intelligens‑, ytelses‑ og prisanalyse», så de fremtredende tallene lovende ut: færre dokument‑resonneringsfeil og nye kodeevner som overgikk både Opus 4.6 og Sonnet 4.6. De ferske dataene som nå dukker opp, forteller en mer nyansert historie. På NYT Connections‑utvidet benchmark fikk Opus 4.7 41 prosent, mot 94,7 prosent for 4.6, og utviklere i virkeligheten melder om regresjon i kode‑ og forskningsoppgaver. Den oppblåste token‑mengden gir 5‑35 prosent høyere faktiske kostnader, selv om listeprisen forblir uendret. Oppgraderingen er viktig fordi mange virksomheter har bygget pipelines rundt den forutsigbare token‑økonomien og API‑kontrakten til Opus 4.6. Plutselig token‑inflasjon undergraver budsjettprognoser, mens de ødelagte endepunktene krever kodeomskrivinger og testing. Samtidig åpner de visuelle forbedringene for nye produktmuligheter i bransjer som detaljhandel, medisinsk bildediagnostikk og autonom inspeksjon, og kan potensielt endre Anthropics konkurranseposisjon i forhold til OpenAIs multimodale tilbud. Hva du bør holde øye med videre: Anthropics migrasjons‑sjekkliste, som skal publiseres senere denne uken, vil detaljere token‑konverteringsformler og anbefalte prompt‑justeringer. Fellesskapet tester allerede work‑arounds for å dempe kostnadsøkningene, og et oppfølgings‑patch sies å være planlagt til tidlig i mai for å adressere regresjonen i språkmodellen. Følg med på om Anthropic justerer prisene eller gjeninnfører en «drop‑in»‑tier, og hvordan rivaliserende leverandører svarer med egne multimodale oppgraderinger.
29

OpenAI trekker seg fra Force Codex for å bære kostnadene

Mastodon +6 kilder mastodon
openaisora
OpenAI kunngjorde en omfattende omorganisering som vil føre til at forskningsavdelingen blir integrert i Codex‑plattformen, og at Sora‑prosjektet for videogenerering blir avviklet. Selskapet uttalte at de nå «strukturere alle innsatsområder rundt økonomisk ansvarlighet i stedet for moon‑shot‑utforskning», og at beregningsbudsjetter blir den primære portvokteren for nytt arbeid. Som følge av dette vil vitenskapsdivisjonen – som tidligere forfulgte langsiktige gjennombrudd innen multimodal AI – bli absorbert av Codex, AI‑assistenten som allerede styrer en skrivebordskursor, genererer bilder, husker brukerpreferanser og driver et stadig voksende katalog av plugins. Dette trekket markerer et tydelig skifte fra OpenAIs selvbeskrivelse som et forskningslaboratorium til en ren plattformvirksomhet. Ved å kanalisere all utvikling inn i et inntektsgenererende produkt, håper firmaet å rettferdiggjøre den massive sky‑beregningskostnaden som har vokst i takt med lanseringen av GPT‑4‑Turbo og den nylige Claude Opus 4.7‑oppdateringen fra konkurrentene. Beslutningen kommer også etter de høyt profilerte avgangene til Kevin Weil og Bill Peebles, som vi rapporterte om 18. april, samt selskapets bredere innsats for å kvitte seg med «side‑oppdrag» som ikke direkte bidrar til bunnlinjen. Hvorfor dette er viktig er todelt. For det første kan konsolideringen av forskning under Codex akselerere utrullingen av funksjoner som visker ut skillet mellom kodegenerering og generell AI, og gi OpenAI en sterkere defensiv posisjon mot Anthropics nylige fremskritt. For det andre kan fokuset på kostnadsdrevet prosjektutvelgelse bremse tempoet i grunnleggende gjennombrudd, og dermed endre konkurranselandskapet for fundamentale modeller og potensielt dempe den åpne forskningsånden som en gang definerte sektoren. Det som bør følges med på videre inkluderer tidslinjen for Soras endelige nedstengning, utrullingen av neste Codex‑oppdatering – forventet å utdype skrivebordsintegrasjonen og utvide plugin‑økosystemet – samt eventuelle regulatoriske reaksjoner på OpenAIs nye «økonomisk ansvarlighets»-rammeverk, spesielt etter selskapets støtte til Illinois' ansvarsforsikring tidligere denne måneden. Bransjen vil være ivrig etter å se om skiftet leverer bærekraftig vekst eller signaliserer et tilbaketrekning fra ambisiøs AI‑forskning.
29

OpenAI støtter Illinois‑lovforslag som beskytter AI‑selskaper mot ansvar ved massedødsfall

Mastodon +6 kilder mastodon
anthropicopenai
OpenAI har kastet sin vekt bak Illinois Senate Bill 3444, et tiltak som vil gi utviklere av banebrytende AI immunitet mot søksmål som følge av «massedødsfall»-hendelser – definert som hendelser som forårsaker 100 eller flere dødsfall eller medfører skader som overstiger en milliard dollar. Lovforslaget, som beveger seg gjennom delstatens lovgivende forsamling, søker å beskytte selskaper mot sivilt ansvar når deres modeller brukes i scenarier som utløser katastrofale skader, som for eksempel autonome våpenutplasseringer, store desinformasjonskampanjer eller feilende industrielle AI‑systemer. OpenAIs støtte markerer den første høytprofilerte støtten til forslaget; Anthropic, et annet ledende laboratorium, har offentlig motsatt seg det, og advarer om at generelle beskyttelser kan svekke ansvarlighet og etterlate ofre uten mulighet for erstatning. Tilhengerne hevder at juridisk klarhet vil oppmuntre til fortsatt investering i avansert AI, som for tiden møter et lappete nett av statlige søksmål og den truende faren for ruinøse dommer. Kritikere svarer med at skjoldet kan skape en moralsk fare, ved å la selskaper overlate ansvaret for sikkerhetstesting og risikoreduserende tiltak til regulatorer eller sluttbrukere. Lovforslaget kommer i en bølge av lovgivende aktivitet rettet mot AI, fra Pentagon‑samtaler om sikre tilpassede brikker til føderale debatter om ansvarsmekanismer. Hvis det vedtas, vil Illinois bli et prøvested for en modell med begrenset bedr
26

Folk som prøver å kontrollere LLM-er er bare W40K Tech‑priest som ber til Maskinånden, send tut. #

Mastodon +6 kilder mastodon
Et viralt innlegg på X denne uken utløste en ny bølge av debatt om hvordan teknologibransjen forsøker å «temme» store språkmodeller (LLM‑er). Meldingen, postet av AI‑kommentatoren Mikael Sundberg, liknet moderne forsøk på LLM‑styring med en Warhammer 40 K Tech‑priest som synger til Maskinånden: «Folk som prøver å kontrollere LLM‑er er bare W40K Tech‑priests som ber til Maskinånden. Send tut.» Den spøkefulle analogien samlet raskt tusenvis av likes, retweets og en flom av kommentarer fra forskere, etikere og hobbyister. Sundbergs sammenligning treffer en langvarig kulturell spenning. På den ene siden ruller selskaper og regulatorer ut sikkerhetsrammer – API‑er for filtrering av prompt, revisjoner av bruksretningslinjer og nye bestemmelser i «AI‑act» – som skal holde generativ AI i tråd med samfunnsnormer. På den andre siden argumenterer utviklere for at slike tiltak ofte ligner mer på rituell overtro enn på ingeniørkunst, en følelse som gjenspeiles i Warhammer‑lore hvor Adeptus Mechanicus tror at hver feil er en misfornøyd Maskinånd som må beroliges gjennom seremonier. Hvorfor metaforen er viktig, er tosidig. For det første tydeliggjør den en økende frustrasjon over at topp‑ned‑kontroller kan kvele innovasjon uten å løse de underliggende tekniske utfordringene med justering og tolkbarhet. For det andre former den memedrevne innrammingen den offentlige diskursen, og gjør en teknisk politisk debatt til en kulturell fortelling som resonnerer med et bredere, ikke‑teknisk publikum. Ved å hente inspirasjon fra et elsket sci‑fi‑univers senker innlegget terskelen for lekfolk til å engasjere seg i komplekse AI‑sikkerhetsspørsmål. Det som bør følges med på videre er bølgene som sprer seg i politiske kretser og i bransjens veikart. Konsultasjonen til EU‑kommisjonens AI‑act, som forfaller senere denne måneden, kan referere til argumentet «ritual vs. rigor» når interessenter presser på for tydeligere, standardbasert etterlevelse i stedet for ad‑hoc‑sikringer. Samtidig har store LLM‑leverandører kunngjort interne «ansvars‑labber» som skal gå utover overfladiske filtre og bevege seg mot modell‑nivå tolkbarhet – et direkte svar på kritikken om at dagens kontroller kun er symbolske. Diskusjonen som ble satt i gang av Sundbergs tweet vil sannsynligvis påvirke hvordan regulatorer, selskaper og publikum konseptualiserer balansen mellom frihet og sikkerhet i neste generasjon av generativ AI.
26

Ledende modeller er nå «nesten uatskillelige» fra hverandre når det gjelder ytelse, ifølge

Mastodon +6 kilder mastodon
En ny rapport fra Stanford Institute for Human‑Centered Artificial Intelligence (HAI) viser at ytelsesgapet mellom verdens ledende språkmodeller i praksis har forsvunnet. På tvers av en rekke benchmark‑oppgaver scorer OpenAIs GPT‑4‑Turbo, Anthropics Claude 3, Googles Gemini 1.5 og en rekke åpne modeller som Llama 3 og Mistral‑7B alle innen noen få prosentpoeng fra hverandre. Studien beskriver fenomenet som «nesten uatskillelighet» og påpeker at åpne modeller nå er «mer konkurransedyktige enn noen gang» og konvergerer mot samme kapabilitetsgrense. Konvergensen er viktig fordi den snur opp ned på den tradisjonelle kappløpet som har vært drevet av ren kapasitet. Når råresultatene ikke lenger skiller leverandørene, flytter konkurransepresset seg mot sekundære egenskaper: inferenskostnad, latens, fleksibilitet for fin‑tuning, sikkerhetsverktøy og økosystem‑binding. For bedrifter innebærer dette et bredere valg av løsninger og muligheten til å bytte fra en proprietær API til en åpen modell uten å gå på kompromiss med ytelsen. For bransjen vil kappløpet sannsynligvis intensiveres rundt beregningseffektivitet, prismodeller og sertifiseringer for ansvarlig AI i stedet for oppsiktsvekkende kapabilitetsoppgraderinger. Som vi rapporterte 17. april, antydet vår reproduksjon av Anthropics Mythos‑funn med offentlige modeller allerede en innsnevring av gapet; Stanford‑rapporten bekrefter at trenden nå er systemisk. De kommende månedene vil vise hvordan selskapene reagerer. Følg med på lanseringen av neste generasjons åpne modeller, prisjusteringer fra skyleverandører og nye benchmark‑pakker som HELM 2.0, som har som mål å fange kostnadseffektivitet og sikkerhetsmålinger. Reguleringsorganer forventes også å fokusere på åpenhet og justeringsstandarder, og gjøre disse kriteriene til nye konkurranse­leveranser i et marked hvor rå ytelse ikke lenger er differensieringsfaktoren.
26

Wei Ping (@_weiping) på X

Mastodon +6 kilder mastodon
deepseek
Kinesisk AI‑lab Zhipu AI har publisert en teknisk rapport om sin nyeste store språkmodell, GLM‑5, og dokumentet blir allerede hyllet som den mest imponerende analysen siden DeepSeek‑V3/R1. Rapporten, som ble fremhevet av NVIDIA‑forsker Wei Ping på X, beskriver en rekke innovasjoner innen oppmerksomhetseffektivitet – inkludert en hybrid variant av effektiv oppmerksomhet, sparsomme oppmerksomhetsmønstre og en glidende‑vindu‑mekanisme – støttet av omfattende ablasjonsstudier og ytelsesbenchmarker. Betydningen ligger i modellens evne til å levere sammenlignbar eller overlegen perplexity i forhold til samtidige modeller, samtidig som den reduserer minne‑ og beregningsbehovet med opptil 40 prosent. Slike gevinster adresserer de økende kostnadene ved trening og drift av modeller med flere milliarder parametere, et flaskehals som har bremset bredere utrulling utenfor velstående sky‑leverandører. Ved å publisere detaljerte eksperimentelle data gir GLM‑5‑teamet forskningssamfunnet reproducerbare innsikter som kan akselerere adopsjonen av sparsomme og lokalitets‑bevisste oppmerksomhetsmekanismer i LLM‑økosystemet. Wei Pings godkjenning har vekt: hans arbeid i NVIDIA fokuserer på maskinvare‑bevisst modellutforming, og hans offentlige ros signaliserer at GLM‑5‑teknikkene er kompatible med selskapets kommende H100‑kompatible programvare‑stack. Hvis funnene blir gjort tilgjengelige som åpen kildekode eller integrert i NVIDIA‑s TensorRT‑LLM, kan utviklere oppleve umiddelbare ytelsesforbedringer på eksisterende infrastruktur. Det som er verdt å følge videre, er den formelle utgivelsen av GLM‑5‑vektene, forventede benchmark‑resultater på HELM‑ og MMLU‑suite‑ene, samt eventuelle partnerskapskunngjøringer mellom Zhipu AI og maskinvareleverandører. Like viktig vil være oppfølgingsartikler som utforsker skalering av de rapporterte oppmerksomhetsvariantene til trillion‑parameter‑regimer, et steg som kan omforme konkurranselandskapet mellom kinesiske og vestlige LLM‑utviklere.
26

Tinder og Zoom tilbyr øyeskanning som «bevis på menneskelighet» for å bekjempe AI

Mastodon +6 kilder mastodon
Tinder og Zoom har kunngjort at de vil integrere øyeskanningsteknologi i sine plattformer som et «bevis på menneskelighet»-tiltak rettet mot å dempe AI‑generert etterligning og bot‑aktivitet. Funksjonen, som er planlagt for en begrenset betaversjon senere i dette kvartalet, tar en rask skanning av netthinnemønsteret gjennom enhetens kamera og sammenligner den med en sikker, lokal mal for å bekrefte at brukeren er en levende person før tilgang til videosamtaler eller profilinteraksjoner gis. Tiltaket kommer etter en bølge av deep‑fake‑ og syntetisk‑stemme‑angrep som har svekket tilliten til sanntidskommunikasjonsverktøy. Zoom, som i samarbeid med Worldcoin har testet biometri‑verifisering i en sak vi dekket 18. april, utvider nå denne tilnærmingen til et bredere forbrukermarked. Tinder, som sliter med automatiserte «swipe‑farmer» som oppblåser match‑tall, ser på øyeskanningen som en måte å beskytte ekte brukerengasjement og redusere svindelrelaterte utestengelser. Utover den umiddelbare sikkerhetsgevinsten reiser utrullingen betydelige personverns‑spørsmål. Biometriske data som netthinnemønstre klassifiseres som «sensitiv personlig informasjon» under EUs personvernforordning (GDPR) og de nordiske databeskyttelses‑rammeverkene, noe som betyr at selskapene må lagre og behandle skanningene med strenge sikkerhetstiltak. Kritikere hevder at overlevering av slike data til en kommersiell datingtjeneste og en videokonferanse‑gigant kan sette en presedens for kommersiell innhøsting av biometrisk informasjon, særlig dersom skanningene senere brukes til reklame eller selges til tredjeparter. Hva som er viktig å følge med på: Begge selskapene har lovet kun «opt‑in»-deltakelse, men regulatorer i Sverige, Norge og Finland forventes å granske samtykkemekanismer før funksjonen lanseres. Bransjeobservatører vil også holde øye med brukeradopsjonsrater og eventuell motstand på sosiale medier, noe som kan påvirke om andre plattformer – som Microsoft Teams eller Metas Horizon – tar i bruk lignende øyebaserte verifiseringer. Suksessen eller feilen med dette biometriske satsingsspillet vil forme balansen mellom AI‑drevet bekvemmelighet og personvern i det nordiske teknologimiljøet.
24

Shapley‑verdi‑styrt adaptiv ensemble‑læring for forklarbar finansiell svindeldeteksjon med validering av amerikansk regulatorisk etterlevelse

ArXiv +5 kilder arxiv
Et team av forskere ledet av Mohammad Nasir Uddin har lagt ut en ny arXiv‑pre‑print, *Shapley Value‑Guided Adaptive Ensemble Learning for Explainable Financial Fraud Detection with U.S. Regulatory Compliance Validation* (arXiv:2604.14231v1). Artikkelen foreslår et adaptivt ensemble som dynamisk velger de mest prediktive basis‑lærerne for hver transaksjon og kobler dem med et SHAP‑basert attribusjonslag som gir forklaringer per post. Ved bruk av PaySim‑simulatorens datasett med 6,36 millioner transaksjoner rapporterer forfatterne en økning på 4,2 prosentpoeng i AUC sammenlignet med en standard gradient‑boosted baseline, samtidig som de leverer forklaringer som oppfyller Office of the Comptroller of the Currencys (OCC) revisjonskriterier. Arbeidet er viktig fordi økonomisk kriminalitet nå tapper mer enn 32 milliarder dollar årlig fra amerikanske institusjoner, og regulatorene strammer inn på ugjennomsiktig AI. Som vi rapporterte 18 april, krever OCC og andre etater transparente, reviderbare modeller for risikoområdet i banksektoren. Ved å integrere Shapley‑verdier direkte i beslutnings‑pipeline, lover den nye metoden både den prediktive kraften til moderne ensembler og sporbarheten som kreves for etterlevelse, noe som potensielt kan åpne for bredere AI‑adopsjon i svindelforebyggende systemer som hittil har vært avhengige av eldre regelbaserte løsninger. Det neste å holde øye med er tre konvergerende utviklinger. For det første har forfatterne sendt manuskriptet til *IEEE Transactions on Knowledge and Data Engineering*, så fagfellevurderingsresultatene vil signalisere akademisk validering. For det andre har flere amerikanske banker uttrykt interesse for å pilotere rammeverket under OCCs kommende AI/ML‑veiledning, et skritt som kan gi de første virkelige ytelsesdataene utover syntetiske simuleringer. Til slutt begynner bransjestandardorganer som Financial Industry Regulatory Authority (FINRA) å utforme metrikker for XAI‑etterlevelse; hvordan det Shapley‑styrte ensemblet samsvarer med disse metrikkene vil avgjøre om det blir en de‑facto‑standard for forklarbar svindeldeteksjon.
24

Gmail‑etikettbroen i Claude Cowork har nettopp gått i stykker

HN +6 kilder hn
claudegooglegpt-5reasoning
Claude Coworks Gmail‑etikettbro har gått offline, og etterlater tusenvis av brukere uten mulighet til å synkronisere e‑postetiketter med det AI‑drevne arbeidsområdet. Feilen dukket opp tidlig tirsdag da integrasjonen, som automatisk speiler Gmail‑etiketter som prosjekt‑tagger i Claude‑Cowork, begynte å returnere 502‑feil. Anthropic bekreftet driftsavbruddet på sin status‑side, og tilskrev det en nylig endring i Googles Gmail‑API som ødela autentiseringsflyten som broen benytter. Feilen er viktig fordi broen er en hjørnestein i Claude Coworks løfte om å gjøre vanlige innbokser til samarbeids‑kunnskapsbaser. Ved å trekke etikettdata inn i Claudes kontekstvindu, kan systemet fremheve relevante tråder, foreslå neste‑steg‑handlinger og forsyne modellen med oppdatert informasjon uten manuell kopiering og liming. Bedrifter som har bygget interne arbeidsflyter rundt denne automatiseringen, står nå overfor stopp i saksruting, forsinkede godkjenninger og et plutselig behov for å gå tilbake til manuelle prosesser. Med Googles brukerbase på 2 milliarder, får selv en nisjefeil bølger gjennom det bredere AI‑produktivitetmarkedet, og understreker hvor tett moderne arbeidsverktøy er avhengige av stabile tredjeparts‑API‑er. Anthropic har lovet

Alle datoer