
Alt iLive-indhold gennemgås medie eller kontrolleres for at sikre så meget faktuel nøjagtighed som muligt.
Vi har strenge sourcing retningslinjer og kun link til velrenommerede medie websteder, akademiske forskningsinstitutioner og, når det er muligt, medicinsk peer reviewed undersøgelser. Bemærk at tallene inden for parentes ([1], [2] osv.) Er klikbare links til disse undersøgelser.
Hvis du mener, at noget af vores indhold er unøjagtigt, forældet eller på anden måde tvivlsomt, skal du vælge det og trykke på Ctrl + Enter.
Stemme som analyse: Tidlige signaler på kræft og godartede læsioner
Sidst revideret: 18.08.2025

Forskere fra Oregon Health & Science University analyserede taleoptagelser fra det nye offentligt tilgængelige Bridge2AI-Voice-datasæt og fandt en simpel akustisk funktion, der kan afsløre stemmebåndspatologi. Vi taler om harmoniske-til-støj-forholdet (HNR) - forholdet mellem "musikalske overtoner" og støj. Dets niveau og variabilitet adskilte stemmerne fra personer med larynxkræft og godartede læsioner fra raske og nogle andre stemmeforstyrrelser. Effekten var især tydelig hos cisgender-mænd; statistisk signifikans var ikke nok for kvinder - forfatterne skylder på den lille stikprøvestørrelse og opfordrer til en udvidelse af dataene. Arbejdet blev offentliggjort som en kort rapport i Frontiers in Digital Health.
Baggrund for undersøgelsen
- Hvorfor overhovedet lede efter "stemmemarkører"? Hæshed er en almindelig klage. Årsagerne er forskellige: fra forkølelse og refluks til knuder/polypper og larynxkræft. I øjeblikket er vejen til diagnose et besøg hos en øre-næse-hals-læge og en endoskopi (et kamera i næse/hals). Det er nøjagtigt, men ikke altid hurtigt tilgængeligt og er ikke egnet til selvmonitorering i hjemmet. Forhåndsscreening er nødvendig: en enkel måde at forstå, hvem der skal se en læge først.
- Hvad er en stemmebiomarkør? Tale er et signal, der nemt kan optages på en telefon. Dets "mønster" kan bruges til at bedømme, hvordan stemmebåndene vibrerer. Læsioner gør vibrationerne ujævne: mere "støj" og mindre "musik".
- Hvorfor nye datasæt er vigtige. Tidligere var sådanne arbejder afhængige af små, "hjemmelavede" stikprøver - modellerne var skrøbelige. Bridge2AI-Voice er et stort, multicenter, etisk indsamlet sæt af lydoptagelser knyttet til diagnoser. Det blev oprettet som et "fælles testområde" for endelig at træne og teste algoritmer på store og heterogene data.
- Hvor er de største vanskeligheder?
- Stemmen ændrer sig på grund af mikrofonen, støj i rummet, kulde, rygning, sprog, køn og alder.
- Der er traditionelt færre kvindelige data, og den kvindelige stemme er højere i frekvens - metrikker opfører sig anderledes.
- Ingen "hjemme"-test kan erstatte en undersøgelse eller stille en diagnose - højst hjælper den med at afgøre: "Er det nødvendigt at kontakte en øre-næse-hals-læge akut?"
- Hvorfor har klinikken og patienterne brug for dette? Hvis personer med høj risiko for lymfeknuder/tumorer kan prioriteres ved en kort aftale, vil dette fremskynde diagnostikken, reducere unødvendige henvisninger og give et værktøj til selvmonitorering mellem besøg (efter operation, under behandling).
- Hvor dette bør føre til: Validerede telemedicinske applikationer/moduler, der:
- skriv en tale i henhold til standarden (frase + langtrukken "aaa"),
- beregn grundlæggende funktioner (HNR, jitter, shimmer, F0),
- udstede en anbefaling om at kontakte en specialist, hvis profilen er alarmerende,
- opretholde dynamik efter behandlingen.
Ideen er enkel: "giv telefonen til øret på en øre-næse-hals-læge" – ikke for at stille diagnoser, men for ikke at overse dem, der har brug for hurtig personlig hjælp.
Hvad gjorde de præcist?
- Vi tog den første udgivelse af det multicenter, etisk indsamlede Bridge2AI-Voice-datasæt, et flagskibsprojekt hos NIH, hvor stemmeoptagelser er knyttet til klinisk information (diagnoser, spørgeskemaer osv.).
- To analytiske prøver blev dannet:
- "larynxkræft / godartede lymfeknuder / sund";
- "kræft eller godartede knuder" versus spasmodisk dysfoni og stemmebåndslammelse (andre almindelige årsager til hæshed).
- Grundlæggende stemmetræk blev identificeret ud fra standardiserede fraser: grundtone (F0), jitter, shimmer og HNR, og grupperne blev sammenlignet ved hjælp af ikke-parametrisk statistik. Resultat: De mest stabile forskelle var i HNR og F0, hvor HNR og dens variabilitet bedst adskilte benigne læsioner fra både normen og larynxkræft. Disse signaler var mere tydelige hos mænd.
Hvorfor er dette vigtigt?
- Tidlig screening uden sonde. I øjeblikket er vejen til diagnose ofte nasoendoskopi og, hvis der er mistanke om det, biopsi. Hvis simple akustiske funktioner kombineret med kunstig intelligens kan prioritere dem, der har brug for endoskopi, vil patienterne komme hurtigere til en øre-næse-hals-specialist, og unødvendige henvisninger vil blive reduceret. Dette er et supplement, ikke en erstatning for lægen.
- Big data til stemme. Bridge2AI-Voice er et sjældent projekt, hvor stemme indsamles ved hjælp af ensartede protokoller og forbindes med diagnoser; dataene er tilgængelige for forskere via PhysioNet / Health Data Nexus. Dette accelererer udviklingen af pålidelige stemmebiomarkører i stedet for "mirakelapps" på små stikprøver.
Hvad er HNR?
Når vi taler, vibrerer stemmebåndene og skaber overtoner (harmoniske). Men vibrationen er aldrig perfekt - der er altid støj i signalet. HNR er simpelthen, hvor meget mere "musik" der er i stemmen end "hvæsen". Når stemmebåndene er beskadiget, bliver vibrationen mindre jævn - der er mere støj, HNR falder, og dens spring (variabilitet) øges. Dette er det mønster, som forfatterne fangede.
Vigtige ansvarsfraskrivelser
- Dette er en pilotanalyse, en eksplorativ analyse: uden klinisk validering, med begrænsninger på stikprøven af kvinder - så deres effekter var ikke signifikante. Der er behov for større og mere forskelligartede data og "roasting" af modeller i forskellige klinikker og på forskellige sprog.
- Stemmen er en "multiværdi" ting: den påvirkes af forkølelse, rygning, refluks, en mikrofon, støj i rummet. Enhver "hjemmetest" bør kunne tage højde for konteksten - og stadig fungere som et filter for en henvisning til en øre-næse-hals-specialist, og ikke en diagnose, der stilles med et klik.
Hvad er det næste?
- Udvid datasættet (inklusive for kvinder og aldre), standardiser opgaver og akustik (læsning af en sætning, forlænget “aaa” osv.), afprøv multimodale modeller (stemme + spørgeskemasymptomer/risikofaktorer).
- Forbind akustiske tegn med undersøgelsesresultater (endoskopi, stroboskopi) og dynamik efter behandling - så HNR-profilen også kan bruges til monitorering.
- Fortsæt "åben videnskab": Bridge2AI-Voice udgiver allerede versioner af datasættet og værktøjerne - dette er en chance for hurtigt at nå ud til rigtige pilotprojekter i klinikker.
Konklusion
Det er muligt at "høre" problemer med stemmebåndene fra stemmen – og måske henvise personen til den rette specialist hurtigere. For nuværende er det et ret godt fingerpeg (HNR og dens variabilitet), men takket være store mængder åbne data har stemmebiomarkører endelig en chance for at blive et pålideligt screeningsværktøj.
Kilde: Jenkins P. et al. Stemme som biomarkør: Eksplorativ analyse af benigne og maligne stemmebåndslæsioner. Frontiers in Digital Health, 2025 (accepteret til offentliggørelse). Data — Bridge2AI-Voice (NIH/PhysioNet).