Torsdag, Mars 12, 2009

LVA-technology and Nemesysco's official statement

Two documents relating to the ongoing debate on Nemesysco’s technology and its validity:

The first is a contribution to the discussion of technical aspects behind the technology, “LVA-technology: A short analysis of a lie”. I discuss the shortcomings of the technology on which Nemesysco’s “emotion detection devices” (lie-detectors) are based. This is not a complete analysis but it exposes the essential problems. In a forthcoming development I will assess in more detail the impact of spurious acoustic background activity.

The second document is Nemesysco’s official standpoint regarding the critique that Anders Eriksson and I have directed to their systems. Anders Eriksson and I present the original document along with our comments on Nemesysco’s official response, displayed as sticky notes. (Additional layout of the same document with notes listed on separate pages).

 

Additional links to news on this issue

The Guardian, UK, 12 March 2009, on the evaluation of "Voice Risk Analysis" (English)http://www.guardian.co.uk/technology/blog/2009/mar/12/voice-risk-analysis-lie-detection-benefits-government-results?commentpage=1

The Guardian, UK, 12 March 2009 (English)
http://www.guardian.co.uk/technology/2009/mar/12/voice-analysis-system-vra


Sveriges Radio, P1, Sweden, 12 March 2009 (Swedish)
http://www.sr.se/cgi-bin/p1/program/artikel.asp?ProgramID=406&Nyheter=1&artikel=2692051

BBC, UK, 12 March 2009 (English)
http://news.bbc.co.uk/1/hi/england/nottinghamshire/7938447.stm

Expresso, Portugal, 10 March 2009 (Portuguese)
http://aeiou.expresso.pt/cientista_portugues_ameacado_com_processo_judicial=f502023

Swedish Research Council, 21 February 2009 (Swedish)
http://www.vr.se/huvudmeny/pressochnyheter/nyhetsarkiv/nyheter2009/hotfarintetystaforskning.5.ead945b11f699b508580002990.html

Swedish Research Council, 23 February 2009 (English)
http://www.vr.se/mainmenu/pressandnews/newsarchive/news2009/threatsmustnotsilenceresearch.5.ead945b11f699b508580003127.html

 

Fredag, Februari 13, 2009

LVA-technology: Can authorities afford the bluff?

Combating fraud with fiction

To combat fraud, authorities and insurance companies in the UK invested public funds in voice-based lie-detectors to discourage the public from entering false claims[i]. The deterrent effect was significant and there were substantial savings as the number of accepted claims dropped dramatically[ii]. Yet a pertinent ethical problem is that these “lie-detectors” are based on Nemesysco’s[iii] LVA-technology and there is no scientific assessment of the technology that suggests it works. The technology does not extract relevant information from the speech signal but even if it would perform correct phonetic analysis the relevance of such measurements to correctly assess the speaker’s emotional state still is at issue. Indeed the LVA-technology claims to assess the speaker’s state of mind exploring the minute traces that it leaves in speech waveform but an analysis of the LVA patent[iv] indicates that the technology falls miserably short of its suggestion of high precision analysis. All it does is counting local maxima and minima (“thorns”) within a three-samples’ running window, and a simple statistic over “plateaus” in the waveform, performed on a crudely digitized (11.025 kHz, 8-bit/sample) speech signal. In fact, the crudeness of the amplitude coding is even worse than 8-bit/sample because the signal is further “filtered” in yet another quantization step that ends up representing the amplitudes in only 85 levels (as compared to the already poor 256 levels of the 8-bit representations). There is no rationale for why counting just such thorns and plateaus, where the amplitude and time information is lost, would be meaningful and no logic principle is provided for why the subsequent operations and the thresholds involved in them would possibly lead to any valid estimate of the speaker’s mental state. The system’s estimate of the speaker’s mental state is difficult to predict because it is based on the unstable thorns and plateaus in an acoustic wave which are influenced by room acoustics, noise or anything that changes the number of thorns and plateaus. Under optimal circumstances these measures would indeed describe gross average characteristics of the speech wave but they are so crude that for any given count of thorns and plateaus there is a vast family of curves that would be interpreted by the LVA-technology as being exactly the same, although many of them would not even resemble a speech signal. This is an immediate consequence of the low information content of the analysis. It simply cannot distinguish the signals from each other. This is probably also the reason why the LVA-systems are perceived as being robust. Since they rely on highly noisy and crude measures, it is difficult to distinguish anything at all, so changes in the background noise or other spurious acoustic accidents go simply unnoticed. It is like trying to seeing the world through greasy glasses. For both the speaker and the tester this erratic behavior may easily give the impression that the system picked up something “deep” that not even the speaker knows about. Finally, “certified” personal issues the final interpretation of these “complex” instrumental results. That does not make things better. Unless the certified personal has some independent basis for the judgment, analyzing a non-valid output is simply irrelevant.

 

Why were not relevant questions asked from the beginning?

An intriguing aspect of all this is how come such a “technology” could be adopted by some of the British authorities. Why were not the highly competent speech scientists in the UK asked to look at this amazing technology? It would have been enough to ask one of my first grade students of Phonetics, I believe. Did not the responsible authorities suspect that Nemesysco’s promises were “too good to be true”? Is it a calculated risk of using the technology’s deterrent effect, as long as it’s lack of basis is not denounced to the public? I find it hard to believe that authorities would engage in undermining the public’s respect by engaging in such practices and it simply doesn’t make sense for me. Isn’t it predictable that someone would eventually point out the hoax? Did anyone believe that it would be possible to choke scientists’ freedom of speech or were there a hope that no one would even bother to address the issue?

I have no answer to these questions but one thing is for sure: Nemesysco’s sellers must be extremely convincing and well organized to have succeeded in this way. But of course there must also be a wide range of people willing to listen and being convinced by their arguments. From the buyer’s short-term perspective it may be easy to think that, as long as we fool people that are naïve enough to believe in this hoax, no harm is done, but isn’t it obvious that this will backfire and has the potential of eventually affect even those who are not fooled into the false belief?

 

Ungrounded scientific claims cannot be left unchallenged

Unfortunately scientists may have contributed to the “success” of the LVA-technology by understandably refusing to study its arbitrary principles, thereby leaving the public scene to be taken by Nemesysco’s propaganda. A pedagogic scientific effort may be necessary to explain for the public why the LVA-technology cannot work. Now Nemesysco’s resources have grown so large that they could even force the withdrawal of a peer-reviewed paper questioning its technology, rather than engaging in the scientific debate[v]. Nemesysco’s official excuse was that the paper is defamatory because we use the word “charlatanry” but I believe this is wrong. The word is used in a general sense and to be a charlatan the person is supposed to know that the product actually does not work, but we do not imply that the inventor actually knows that. On the contrary, we rely on a published interview with the inventor where he says he has no formal academic competence in speech processing and we draw the conclusion that he may indeed not have been aware of the lack of scientific basis of the method he proposes. To be unaware of LVA-technology’s fundamental problems is okay (perhaps naïve) before the publication of our paper. Perhaps a more plausible reason for Nemesysco’s action was that our paper was damaging their business, as also stated in their lawyer’s first letter. Indeed, rather than discussing percentages of correct responses (which any random system obviously generates) our paper addressed the validity of the method, not its reliability, and the only way of discussing validity is to argue convincingly in support of the technology’s fundamental principles. I believe there are none, so the next “best” option was to shoot the messenger so that the news does not spread…

 

The validity of LVA-technology remains unproven

So now it is known, unless someone proves that we are wrong, that LVA-technology does not live up to the claims of detecting a speaker’s emotional state using samples of her/his speech. The issue is of no scientific interest and not even in my main field of research but I happened to be curious about the principles of the LVA-technology and I do have the necessary background to address the question, from both the speech-processing and the phonetic perspectives. As researcher, being paid by public funds, I also have the responsibility of denouncing that the emperor is naked. However, having said that, I have no illusions that my shouting will last long enough to prevent similar cases in the future. Even if for the moment such LVA-based devices may be removed from official uses, it is likely that the human fascination for “fantastic machines” along with the company’s effective propaganda and possible short-term benefits will soon override my efforts to inform the public. That is worrying but just a part of reality that I have to live with. These devices are not cheap and it will take much courage for the people who invested in them to recognize that they just wasted their money.

 

 

Recovering from a mistake

Meanwhile I would say that it is urgent that authorities, who publicly have praised these devices, take prompt and courageous action to admit that the investment was a mistake. When it becomes known that the LVA-technology does not produce relevant results the public’s confidence on the authorities will be deeply damaged. Professionally conducted structured interviews of (randomly) selected customers will do a far better and responsible job than Nemesysco “lie-detectors”. LVA-technology may be acceptable for entertainment, but not for serious applications influencing people’s lives.

 

 

Related links and references:
Science magazine: http://sciencenow.sciencemag.org/cgi/content/full/2009/210/1
Debate article (Swedish) :
http://www.newsmill.se/artikel/2009/02/03/professor-avsloja-bluffen-om-logndetektorerna
'Ministry of Truth' - www.ministryoftruth.me.uk


[v] Eriksson, A. and Lacerda, Francisco (2007). Charlatanry in forensic speech science: A problem to be taken seriously. International Journal of Speech, Language and the Law, 14, 169-193. http://www.equinoxjournals.com/ojs/index.php/IJSLL/article/view/3775

Söndag, December 28, 2008

Charlatanry in forensic speech science: A problem to be taken seriously

Karin Bojs skriver i dagens DN:s nätupplaga (http://www.dn.se/DNet/jsp/polopoly.jsp?d=597&a=868300) om Anders Erikssons och min artikel ”Charlatanry in forensic speech science: A problem to be taken seriously”. I vår artikel analyserar vi principerna på vilka Nemesisco:s (http://www.nemesysco.com) bygger sin ”Voice Analysis Technology” och vi finner att den redovisade metoden kan, helt enkelt, inte fungera. Med de mätningarna av talsignalen som metoden bygger på är det inte ens fråga om att den s.k. Layered Voice Analysis (LVA) skall kunna fungera i en viss procent av fallen! Det finns ingen som helst relation mellan de måtten som metoden bygger på och de slutsatserna som man vill dra av dessa mätningar. Det förklarade vi i vår artikel, och företaget gillade tydligen inte våra slutsatser.
Men att studera den godtyckliga metoden som företaget har använt sig av är naturligtvis ingen intressant forskningsfråga. Det krävs inte mera än rudimentära kunskaper i akustisk fonetik för att inse att det inte kan finnas någon relation mellan de egenskaperna hos talets akustiska signal som metoden bygger på och sanningshalten i det som sägs. Metoden bygger på beräkningar av ”vändningar” (thorns) och ”stabila områden” (plateaus) hos vågformen. Dessa detaljer hos vågformen påverkas kraftigt av rumsakustik och bakgrundsbuller. Ljudvågorna som kommer från en talares talapparat blandas med reflektioner från tidigare producerade ljudvågor som reflekteras av väggarna, golvet, taket och andra föremål i rummet och blandas dessutom med andra bakgrundsljud. Antalet vändningar och stabila områden som Nemesisco:s system har tillgång till är en fullständig blandning av alla slags ljudvågor, där ljudvågorna som talaren faktiskt producerade är bara en del av helheten. Situationen liknar ett försök att härleda simrörelserna hos ett enskilt barn genom att räkna antal toppar och dalar i en simbassängs vattenyta där samtidigt ett stort antal barn leker i vattnet. I teori skulle det kunna gå, om man hade tillräckligt detaljerad beskrivning av vattenytan, både i tid och rum, och dessutom en adekvat matematiskt modell av relationen mellan kroppsrörelserna och vågorna på vattenytan.  Tyvärr finns i Nemesisco:s metod varken en modell eller tillräckligt mätnoggrannhet för att överhuvudtaget kunna relatera den analyserade vågformen med det som talaren har sagt. Metoden ter sig mera som en slags godtycklig beräkning à la Uppfinnare Jocke. Det är då inte konstigt att systemen fungerar ”lika bra” oavsett om det används på flygplatser, i pubar, ute i trafiken, osv. Politikerna i Storbritannien bör ha ställt sig frågan om hur det kan vara så att Nemesysco:s system klarar av ogynnsamma akustiska miljöer som deras egna röststyrda mobiltelefoner har så svårt att hantera… Skulle det kunna vara för att Nemesysco:s system inte klarar av någon alls? LVA duger, i bästa fall, för underhållning men att försöka presentera en sådan metod som grund för tillämpningar inom säkerhetstjänster, medicin, utbildning, osv. är mycket allvarligt, i synnerhet när inskaffningen av sådan ”teknologi” skall finansieras med skattemedel.
Ur forsknings perspektiv är studien av den s.k. LVA metoden i sig helt ointressant men som forskare är vi moraliskt skyldiga att ställa upp med vår kunskap för att avslöja något som, till bevis om motsatsen ter sig som ren bluff och som dessutom marknadsförs som något av samhälligt intresse. Den typ av marknadsföring måste naturligtvis kontras med kunskap hos potentiella köpare. Vi kan naturligtvis ha fel i vår analys, men den har redovisats på ett klart sätt som möjliggör för Nemesysco att bemöta våra synpunkter med vetenskapliga argument som motbevisar vår analys. Än så länge finns helt enkelt ingen vetenskaplig fråga att diskutera och metoden verkar inte ha någon som helst anknytning till det tillverkarna påstår att den gör och det finns ingen logisk princip bakom det hela. Utan en övertygande förklaring av själva principen är påståenden om ”träffsäkerheten” helt ovidkommande. Dessutom ger träffsäkerheten i sig ingen intressant information. Den måste alltid sättas i relation till antal falskalarm som är förenade med just denna träffsäkerhet. Om falskalarm går hand i hand med antal träffar är systemet inte pålitligt. Det krävs högt antal träffar samtidigt som falskalarms antal är lågt.
För mera information se också:
http://ling-map.ling.su.se/blog/ (Postat kl 17:09 den 11 december 2008 av Eva Lindström)
http://www.diva-portal.org/su/opus/publication.xml?id=13316
doi:10.1558/ijsll.2007.14.2.169

Måndag, Juni 05, 2006

Intryck från Sakai konferens i Vancouver

Igår anlände jag från Vancouver, British Columbia, Canada, där jag deltog i den 5:e Sakai konferensen. Sakai (www.sakaiproject.org) är ett stort internationellt samarbetsprojekt kring Internet-baserat system för högskoleundervisning. Projektet har sitt ursprung i University of Michigan och Indiana University oberoende satsningar på att utnyttja Internet resurser som medel för effektivisering och kvalitetshöjning av deras högskoleundervisning. Snart började även MIT och Stanford universitet att intressera sig för samarbete kring dessa frågor och det dröjde inte länge innan man fick betydande finansiering från Mellon Foundation vilket möjliggjorde att Sakaiprojektet kunde startas januari 2004. Sakaiprojektet omfattar nu 94 universitet, främst i USA och Kanada, men även ett fåtal europeiska universitet som University of Amsterdam, Universidade Politecnica de Valencia, University College Dublin, Oslos universitet och Stockholms universitet deltar i projektet. Utöver universiteten deltar också 13 olika dator- och systemföretag i projektet.

Sakai har snabbt utvecklats till ett omfattande system med en rad olika verktyg som kan utnyttjas för att höja kvaliteten och flexibiliteten vid viktiga delar av den högskoleutbildningen. Som en av (de få, än så länge) lärarna som faktiskt har använt Sakai i stor utsträckning i sin undervisning, såg jag fram emot att utbyta erfarenheter med mina kollegor vid konferensen i Vancouver. Tyvärr var det bara en bråkdel av deltagarna som hade pedagogisk erfarenhet av Sakai och det var inte mera än ett par stycken som hade vågat använda verktyget på det sättet som jag hade gjort i min undervisning. Men det var ändå viktigt att delta i konferensen och nu har en större grupp lärare som ännu inte har vågat satsa på att utnyttja systemet vid undervisningen fått vittnesmål om att det går att uppnå bra resultat, trots alla Sakais barnsjukdomar som än så länge kräver en del fantasi och tålamod vid de första försöken. Utöver mina lärarkollegor hoppas jag att även systemutvecklare, som dominerade konferensen, har fått viktig information om vad som är önskvärt att utveckla beträffande Sakais undervisningsverktyg, framförallt ”Tests & Quizzes”. Vi lärare som efterlyser stöd från systemutvecklare för att förbättra verktygen som kan användas vid träning och examination av studenter, måste naturligtvis vara beredda att ta risken av att använda dessa verktyg för att tillsammans med studenterna skaffa oss en rimlig önskelista och kunna ge feedback om vad som händer när verktygen används i skarpläge. I det avseende kändes det väldigt bra att vara vid Sakais pedagogiska frontlinje och kunna presentera Stockholms universitets erfarenhet av Sakai, som vi lärare och studenter vid institutionen för lingvistik har nu haft i två terminer. De andra universiteten har hittills använt systemet för att organisera studentmaterial, med dropp boxar, diskussioner o.s.v. Det stora konferenstemat var dock att utnyttja systemet för att organisera studentportföljer. Portföljerna byggs med i ett s.k. OSP (Open Source Portfolio) och tänkta som ett system för att samla en enskild students material, från början till slutet av utbildning. Med OSP kan universiteten skapa övergripande mallar för att strukturera portföljerna, så att vissa fält kan länkas och skapa t.ex. studentens CV. Alla uppsatser, betyg, rapporter, eventuella kommentarer från lärare eller kurskamrater, diskussionsinlägg osv. läggs i studentens portfölje. I portföljen kan vissa administrativa fält definieras och t.ex. användas för betygsrapportering. Andra fält skall studenten kunna definiera vem som skall ha tillgång till, organisera olika slags CV för olika typer av jobbansökningar, osv. En mycket intressant aspekt av denna utveckling är universitetet eller en institution kan be sina studenter att svara på enkäter som presenteras vid olika tidpunkter under utbildningen och som är utformade för att ge studenten möjlighet att titta tillbaka på sin process av akademisk utveckling. Michigan State University, t.ex., har utvecklat ett mycket intelligent system av korta enkäter och utvärderingar som sammanhängande täcker hela utbildningen. De satsar på att utnyttja portföljerna för att visa för studenterna själva och för potentiella arbetsgivare, studentens utveckling med avseende på ”Principles of Undergraduate Learning”. Dessa principer omfattar rena kvantitativa mätningar av ämneskunskap, kritisk tänkande, förmågan till integrering och tillämpningen av förvärvad kunskap, utveckling av akademiskt resonemang samt utveckling av politisk, social och etisk medvetenhet. Den amerikanska motiveringen för att satsa på portföljer var i första hand att arbetsgivarna ville veta mera än bara vilka betyg och kurs studenterna hade i baggaget. Enligt det som sades på Sakai konferensen efterlyste arbetsgivarna information om sökandes förmåga till inlärningen, kritiskt tänkande, samarbete, reflektion, osv., som de tyckte inte gick att läsa ur ett CV, kursbeskrivningar och betyg. Jag tycker att tanken är mycket intressant. Visserligen är det mycket som överlappar med målsättningar för Bologna processen men det är bara till vår fördel om verktyg för att effektivt organisera denna information i portföljer skall finnas tillgängliga inom snar framtid. Här i Europa kan Holland vara en förebild för oss i detta arbete (www.surf.nl/portfolio).

Slutligen tycker jag att satsningen som Stockholms universitet som aktivdeltagare i Sakaiprojektet är mycket betydelsefull. Nivån på den grundutbildningen i fonetik där jag under de senaste åren har infört olika Internet-baserade verktyg för test och träning av studenternas ämnesfärdigheter har ökat avsevärt. Resultatet i första hand beror på Internet användningen i sig, utan på att studenterna kan genom dessa system få omedelbar automatiskt feedback på sina inlämningar, kan när som helst se hur de ligger till i förhållande till kursens mål, får klara besked om datum för inlämningar för olika uppgifter, uppsatser osv.

För min del är jag mycket nöjd med att utnyttja Sakai i min undervisning (trots alla buggar och okonventionella lösningar som än så länge man ibland tvingas ta till) och tänker fortsätta utveckla min samling av övningsuppgifter och tentamens frågor, framförallt nu när den nödvändiga initiala arbetsinsatsen börjar löna sig. Dessutom tror jag finns goda förutsättningar till att en del av de tekniska problem som hittills har drabbat systemet kommer att bli åtgärdade efter förra veckans Sakai-konferens, inte minst för att Stockholms universitet kan nu publicera i Sakaiprojektets hemsida information om sina viktiga pedagogiska resultat och framställa en trovärdig önskelista om vad som bör åtgärdas i Sakais test- och övningsverktyg.

Francisco Lacerda, Professor i fonetik med inriktning på spädbarns språkvärld