Ricerca rivoluzionaria su questo è quello che ha detto

La sorprendente efficacia e longevità dell'ormai leggendario questo è quello che ha detto scherzo, recentemente reso popolare di nuovo con l'aiuto di L'ufficio , ha fatto di più che fornire a milioni di persone una risposta istintiva a conversazioni casuali. Ha ora raggiunto un nuovo livello di significato sociale, ispirando una seria ricerca linguistica. Si presenta sotto forma di un documento di ricerca chiamato Ecco cosa ha detto: identificazione del doppio senso , scritto da due studenti di informatica, Chloe kiddon e Yuriy Brun .

Nel loro articolo, la coppia delinea la loro creazione del Doppio senso tramite trasferimento di nomi o DEviaNT approccio che identifica automaticamente le battute che ha detto (TWSS). Chiamano il loro approccio analisi metaforica, che ha un doppio significato tutto suo, e si basa sulla ponderazione di alcune parole come più sexy di altre. Il team ha pesato diversi nomi e verbi sexy, quindi ha eseguito il proprio algoritmo.

Nella loro ricerca, la coppia ha anche scoperto alcune regole interessanti per le battute TWSS. Ad esempio, il rischio di invocare in modo errato una battuta TWSS. Dal loro studio:

Ad esempio, in un contesto sociale, il costo di dire che è ciò che ha detto in modo inappropriato è alto, mentre il costo di non dirlo quando avrebbe potuto essere appropriato è trascurabile.

Per affrontare questo problema e produrre risultati migliori, il team ha utilizzato un algoritmo di apprendimento. Tra l'altro, questo ha determinato la creazione di falsi positivi 100 volte superiore ai falsi negativi.

Dopo aver eseguito DEviANT attraverso una serie di materiale di battute TWSS pre-identificato e citazioni casuali. Nel loro test, hanno usato 1,5 frasi erotiche e 57.000 frasi non erotiche. Il team afferma di aver raggiunto un tasso di successo superiore al 71,4%. Anche se potrebbe non sembrare molto, il team afferma che con un set di dati più ampio, si aspetterebbero risultati più vicini al 99,5%. Inoltre, DEviaNT ha restituito alcuni risultati interessanti. Ancora, dallo studio:

DEviANT ha restituito 28 frasi di questo tipo (tutte legate perché molto probabilmente è un TWSS), 20 delle quali sono vere positive. Tuttavia, 2 degli 8 falsi positivi sono in realtà TWSS (nonostante provengano dai dati negativi dei test): Sì, dammi tutta la crema e se n'è andato. e sì, ma il suo buco a volte puzza davvero.

Alcuni potrebbero sminuire questa ricerca, definendola semplicemente un'allodola e di poco valore. Questo sarebbe un attacco a basso impatto, poiché anche i ricercatori descrivono il loro lavoro come un difficile problema di comprensione del linguaggio naturale. (Questo è quello che ha detto.)

( Nuovo scienziato attraverso L'evaso )