Derfor træner Google sin søge‑AI på dine sider – også når du siger nej

af | maj 7, 2025 | Ikke-kategoriseret

Hvordan Googles AI “Overviews” Trives på Dit Indhold – Selv når Du Frabeder Dig

I en nylig vidneforklaring i en amerikansk antitrust-retssag har Google bekræftet, at deres søge‑AI, som f.eks. AI Overviews, fortsat kan trænes på indhold fra nettet – også selvom udgivere har frabedt sig at blive brugt til AI‑træning. Denne tilgang stiller os alle, fra webshop‑ejere til nøje kuraterede fagblogs, over for nye udfordringer og muligheder.

Baggrunden

Google har længe brugt AI til at generere korte svar og resuméer øverst i søgeresultaterne. Disse såkaldte AI Overviews trækker data fra milliarder af web‑tokens for at give brugerne lynhurtige svar – ofte uden at de klikker videre til den oprindelige kilde Erhvervsnyheder.dk.

Mens udgivere kan fravælge at blive indekseret (via robots.txt), gælder denne afmelding kun for DeepMind‑labets træning af modeller. Når disse modeller flyttes ind i Googles “Search Org”, kan data stadig anvendes til at forbedre AI‑svarene

Hvad betyder det for din hjemmeside?

  • Mindre trafik, men stadig genbrug af dit indhold
    Selv om du blokerer for indeksering, kan Googles søgemaskine stadig “læse” dit indhold for at fodre AI‑modellerne. Resultatet? Du mister værdifuld klik‑trafik, men Google genbruger stadig dine tekster til deres AI‑overviews.
  • Udviklingen mod “Generative Engine Optimization” (GEO)
    Traditionel SEO handler om at rangere højt. Nu gælder det om at blive citeret – at skrive indhold, der er så klart og præcist, at Googles AI vælger netop dine svar som kilde.
  • Risiko for monopolisering
    Google‑retssagen adresserer, hvordan deres dominans i søgning kan hindre konkurrence fra andre AI‑løsninger. For dig betyder det, at du bør diversificere din synligheds‑strategi: både optimere til Google Search og andre AI‑platforme som Bing Copilot eller ChatGPT.
  • Sådan tilpasser du din strategi
  • Spørgsmålsbaseret, klart formuleret indhold
    Skriv overskrifter som spørgsmål og besvar dem præcist i begyndelsen af afsnittene. Eksempel: Hvordan træner Google AI på indhold, selvom jeg fravælger?
    Og giv straks svaret: “Når du fravælger indeksering via robots.txt, forhindrer du kun DeepMind‑labets træning – søge‑organisationen kan stadig læse dit indhold for AI Overviews.”
  • Brug struktureret data
    Implementer FAQ‑schema, HowTo‑schema eller Article‑markup (JSON‑LD), så AI‑crawlere hurtigt kan genkende spørgsmål og svar på din side.
  • Opdatér dine snippets
    Sørg for, at dine metatitler og -beskrivelser indeholder præcise, selvstændige sætninger, der kan genbruges direkte som AI‑svar.
  • Diversificér dine kanaler
    Ud over Google, fokuser på synlighed i andre AI‑assistenter og chatbots (f.eks. ved at uploade indhold til YouTube, LinkedIn, per API‑integrationer).

Fremtidens overblik

Googles retssag kan komme til at ændre spillereglerne: Myndighederne overvejer at forbyde Google at være standard‑søgemaskine i browseren eller tvinge åbne data‑portaler. Indtil da er nøglen til overlevelse at sikre, at din stemme er tydelig, struktureret og AI‑venlig.

SEO ≠ AI‑synlighed. Fremtiden kræver, at du bliver citeret, ikke kun ranker. Gør dit indhold nemt for AI at vælge, brug schema‑markup, og udforsk flere platforme.

1. EU‑lovgivning om ophavsret og data­mining

  • EU’s Ophavsrets­direktiv (2019) indførte en obligatorisk undtagelse for “text and data mining” (TDM) i forbindelse med forskning og delevis også kommerciel brug, men kun hvis indholdet er lovligt tilgængeligt.
  • Mange danske udgivere bruger robots.txt eller metatags til at blokere Googlebot, men det gælder kun indeksering til søgeresultater – ikke nødvendigvis TDM til interne AI‑formål, hvis Google vurderer, at de har en licens eller en undtagelsesret.

2. GDPR og persondata

  • Hvis dit indhold indeholder persondata, skal Google overholde GDPR, men anonymiseret tekst kan stadig bruges til træning, så længe der ikke ryger følsomme oplysninger med.

3. EU’s kommende AI‑lov (AI Act)

  • Det foreslåede EU AI Act vil stille krav om transparens og dokumentation af, hvilke data AI‑systemer trænes på – herunder et krav om, at man skal kunne vise, at man har ret til at bruge dem.
  • Når det træder i kraft (formentlig omkring 2026–27), vil Google skulle dokumentere kilder og brugsret mere detaljeret – også i EU.

Hvad betyder det for dig som dansk udgiver?

  1. Indtil videre er der ingen kendt praksis i EU, der forhindrer Google i at bruge dit åbent tilgængelige indhold til at fodre deres AI‑modeller.
  2. EU‑lovgivningen giver dig dog flere værktøjer:
    • Brug robots.txt eller <meta name="robots" content="noindex"> for at blokere indeksering.
    • Overvej en licensaftale (f.eks. Creative Commons eller kommerciel licens), hvis du vil have mere kontrol over AI‑brug.
  3. Fremadrettet vil AI Act og ophavsretsdirektivet sandsynligvis betyde, at Google og andre AI‑udbydere skal dokumentere, hvor de henter deres træningsdata – og måske spørge om tilladelse.

Kort sagt

I dag er det ikke ulovligt i EU, at Google træner sine søge‑AI’er på dit offentlige indhold, selvom du fravælger indeksering. Men retningen går mod større krav om transparens og rettighedshåndtering, så det kan ændre sig inden for få år.

Hvis du vil være på forkant, kan du overveje at:

  • Publicere under en klar licens
  • Tilføje tydelig robots.txt-regler
  • Følge med i udviklingen af EU AI Act

Så er du rustet, når reglerne skærpes.

Du har flere muligheder for at finstyre, hvad du vil have synligt og hvad du vil holde ude:

MetodeEffektAnbefaling
noindexSiden fjernes fra Google‑index → ingen organisk trafik, ingen AI‑citeringBrug kun på sider, der ikke skal findes (fx interne arbejdsdokumenter, test‑sider)
robots.txt disallowBlokerer crawl fra Googlebot (men ikke nødvendigvis AI‑crawlere)Mindre sikker end noindex, AI‑crawlere kan ignorere det
Struktureret data (schema)Styrker de sider, du vil have AI til at vælge – selvom andre sider noindexesSørg for, at dine vigtigste sider er maksimalt optimeret med Article, FAQ, WebPage‑schema

Forslag til strategi

Bevar dine kerne‑landingssider åbne
– De sider du ønsker at blive fundet på (forside, service‑sider, blog) lader du være indexable. Sørg for de har FAQ‑schema og klare overskrifter.

Noindex “støjende” sider
– F.eks. arkiv‑oversigter, kategori‑lister, testsider, interne kopier. De bidrager ikke til AI‑synlighed og kan med fordel skjules for søgemaskiner.

Styrk de ønskede sider med struktureret data
– Article‑, FAQ‑ og WebPage‑schema gør det nemt for AI at finde netop dine svar.

Overvåg effekten
– Brug Google Search Console og AI‑tests (f.eks. prompt “Find kilde til dette AI‑svar”) til at se, hvilke sider der stadig anvendes.

❓ Ofte stillede spørgsmål

1. Kan jeg stoppe Google i at bruge mit indhold til AI‑overviews ved at noindex?
Nej – en noindex‑tag forhindrer kun, at siden vises i Googles søgeresultater. AI‑crawlere kan stadig “læse” indholdet til træning, medmindre du blokerer via andre tekniske eller juridiske metoder.

2. Hvad betyder det, at Google kan træne sin AI på mit webindhold?
Det betyder, at selvom du blokerer indeksering, kan Googles interne modeller bruge dit offentligt tilgængelige tekst til at generere svar i AI‑overviews, uden at det giver trafik til dine sider.

3. Hvordan optimerer jeg mit indhold, så AI‑overviews vælger mig?
Skriv klart og struktureret, brug spørgsmaalsbaserede overskrifter, implementer FAQ‑schema og Article‑markup. Fokusér på præcise svar, så AI‑modeller nemt kan citere dig.

4. Vil mine sider stadig få trafik, hvis jeg blokerer AI‑træning?
Hvis du blokerer indeksering (noindex), mister du organisk trafik fra Google. I stedet bør du noindex kun de sider, der ikke er vigtige, og optimere dine kerne‑landingssider til både SEO og AI‑synlighed.