Volume 6 Number 3 1996


Susan C. Herring
University of Texas at Arlington


Computer-Mediated Discourse Analysis

This issue of the EJC/REC focuses on discourse analysis -- defined here broadly as the identification of patterns of structure and meaning in language use -- as applied to the analysis of computer-mediated communication (CMC). The impetus for this focus is the growing conviction of many researchers that computer-mediated communication systems are a boon to the study of language-in-use, indeed possibly the greatest boon since the invention of the portable tape recorder in the 1950's.

Where the tape recorder expanded the limits of human memory by enabling verbatim accounts of continuous speech to be recorded and transcribed, text-based computer mediation systems take us beyond the physical limitations of transcription by generating pre-transcribed data which are easily downloaded for analysis. The lack of visual cues in most CMC means that the presence of an observer need not be known to the people whose communication is being studied, thereby allowing for the collection of more authentic, unselfconscious data. Experimental researchers also benefit from the ease with which it is possible to vary aspects of the interaction to test for hypotheses about computers and communication, simply by programming the system to modify electronic messages between the time they are produced by one subject and the time they are received by another.

As if all that were not enough to tempt researchers to investigate computer-mediated discourse, CMC such as takes place on the Internet is also of considerable theoretical interest, as an increasingly popular means of social interaction. By virtue of being carried out exclusively via language, text-based CMC makes transparent as never before the role of language in the presentation of self, and in the genesis and organization of social practices.

Despite this enormous potential, computer-mediated discourse has as yet received little serious attention from language-focused scholars, including those from my own discipline, linguistics. There are various reasons for this, not the least of which is the current fashion within the linguistics discipline for analyzing invented, decontextualized sentences, a trend which has tended to marginalize research on actual language use. Consequently, much of the work that has been published on computer- mediated language to date (e.g., Herring, Ed., 1996) has been done by scholars on the margins of, or entirely outside of, mainstream linguistics. In part because of this, and in part because their numbers are small, researchers studying computer-mediated language have generally had to do so on their own, in relative isolation from one another. Some exciting work has been produced in this manner. However, if the full potential of computer-mediated language studies is eventually to be realized, it is important that available work be brought together, so that the findings of previously isolated researchers can inform the research of others, insights can be consolidated, and the state of our current understanding can more readily be assessed.

The present issue is the first publication, to the best of my knowledge, devoted exclusively to discourse analysis of computer-mediated communication. Three out of the four articles -- those by Paolillo, Condon & Cech, and Miller et al. -- were first presented at a symposium entitled "Computer-Mediated Discourse Analysis" that I organized in March 1995, as a presession of the Georgetown University Round Table on Languages and Linguistics (GURT). The fourth contribution, by Kwang-Kyu Ko, was added in response to a call for papers distributed subsequently on the Internet.

The four articles have in common that they report empirical studies of computer-mediated language. All of the studies also have self-evident implications for issues of practical concern, whether it be the use of CMC in educational settings, for decision-making in organizations, for machine translation, or for the status of languages other than English on the Internet. Beyond these similarities, the four articles analyze different types of CMC -- synchronous chat in natural and experimental settings, asynchronous postings to a Usenet newsgroup, and voice-only computer-mediated transmission. They also represent strikingly diverse approaches to discourse analysis. Ko's text linguistic study considers the distribution of grammatical and lexical markers in a computer-mediated corpus, in an attempt to situate synchronous CMC with respect to spoken and written language. Condon and Cech are psycholinguists concerned with discourse processing, specifically with the differences between computer-mediated and face-to-face negotiation of decision- making tasks. Miller, LuperFoy, Kim and Duff are computer- human-interface researchers designing a discourse module for dialogue management in a machine translation system. Finally, Paolillo brings a sociolinguistic perspective to bear on the analysis of code-switching in a bilingual Usenet group. While the collection is modest in size, and does not represent all approaches to discourse analysis, it nevertheless gives a good indication of the theoretical and methodological diversity that exists within the study of language use, and the fruitfulness of such approaches for the study of computer-mediated language.

Needless to say, this collection is only a beginning. Many other questions about computer-mediated language cry out to be addressed, especially as CMC technology evolves to permit multiple modalities of message transmission. And other methods of language analysis -- from discourse analysis, sociolinguistics, rhetoric, psycholinguistics, corpus linguistics and elsewhere -- await application to computer-mediated data, with the promise of results and new understandings we can as yet only imagine. With open- mindedness and hard work, we may yet realize the boon to language studies that is computer-mediated communication.

Credit is due to the following people for their high- quality professional efforts in producing this issue: the authors of the articles, 18 anonymous reviewers, and the managing editor of the EJC/REC, Teresa Harrison. I extend to them all my sincere thanks.


Herring, S. (Ed.) (1996). Computer-mediated communication: Linguistic, social and cross-cultural perspectives. Amsterdam: John Benjamins.

Susan Herring
Program in Linguistics
University of Texas
Arlington, TX 76019 USA

Phone: (817) 272-3133
Fax: (817) 272-2731

Analyse du discours assistee par ordinateur

Ce numero de la EJC/REC tente de faire le point sur l'analyse du discours - definie ci-apres en tant que identification de formes de structures et de significations dans l'usage du langage - telle qu'elle s'applique dans l'analyse de la communication assistee par ordinateur. Ce qui galvanise bien des chercheurs a se concentrer sur ce sujet c'est leur conviction sans cesse croissante que les systemes de communication assistes par ordinateur constituent une aubaine inesperee pour l'etude du langage parle depassant de loin le profit que l'on a pu tirer de l'emploi du magnetophone portatif depuis son invention dans les annees cinquante.

La ou le magnetophone a fait reculer les limites de la memoire humaine en rendant possible l'enregistrement et la retranscription, mot pour mot et sans interruption de conversation, le systeme de langage base sur des textes et assiste par ordinateur nous permet de depasser les limitations imposees par la retranscription en produisant des donnees retranscrites d'avance qui peuvent facilement etre telechargees dans le but de les analyser. L'absence de signaux visuels dans la plupart des discours assistes par ordinateur (DAPO) signifie que les gens dont on etudie le discours n'ont pas besoin de savoir qu'on les observe, ce qui permet de reunir aisement des donnees moins intimidantes et plus authentiques. La possibilite de varier les aspects de l'interaction qui servent a faire une recherche d'hypotheses concernant les ordinateurs et la communication serait d'une grande utilite aux chercheurs experimentaux. Il leur suffira tout simplement de programmer le systeme en vue de modifier les messages electroniques pendant l'intervale qui separe leur production par un sujet et leur reception par un autre sujet.

A tous ces elements qui incitent les chercheurs a explorer les possibilites du discours assiste par ordinateur vient s'ajouter le discours tel qu'il se produit sur l'Internet, et qui presente egalement un interet theorique considerable en tant que moyen d'interaction sociale croissant. En raison du fait qu'il se produit exclusivement par le langage, le systeme de lan age base sur des textes et assiste par ordinateur met plus que jamais a nu le role du langage dans la presentation du moi et dans la genese et l'organisation des us et coutumes.

Malgre les enormes possibilites qu'offre le discours assiste par ordinateur, les specialistes du langage, y inclus les praticiens de ma propre discipline, a savoir la linguistique, ne s'en sont jusqu'a present peu preoccupes. On pourrait avancer toutes sortes de raisons de cet etat de choses; il suffit de mentionner la vogue actuelle qui prevaut dans la discipline de la linguistique et qui se traduit par une analyse recherchee des phrases inventees ou prises hors de leur contexte. Cet engouement porte les chercheurs a delaisser la recherche sur l'usage propre du langage. On constate donc que la plupart des travaux de recherche faits sur le langage assiste par ordinateur et publies jusqu'a present (par exemple, Herring, Ed., 1996) ont pour auteurs des specialistes qui s'interessent peu ou prou a la linguistique dominante. Les raisons evoquees ci-dessus et le nombre restreint de chercheurs expliquent que ces specialistes de l'etude du langage assitee par ordinateur se soient retrouves isoles et livres a eux-memes dans leurs recherches. Il n'en est pas moins vrai que des travaux importants ont ete produits dans de telles circonstances. Cependant si l'on veut realiser les promesses que tiennent les etudes du langage assistees par ordinateur, il faut avant tout grouper les travaux deja realises pour que les decouvertes faites par certains chercheurs isoles puissent en faire profiter d'autres, que l'on puisse assortir leurs connaissances et evaluer plus facilement l'etat de notre acquis actuel.

Ce numero du journal electronique de la communication est le premier a ma connaissance qui soit consacre exclusivement a l'analyse du discours de la communication assistee par ordinateur. Trois des quatre articles - ceux de Paollilo, de Condon & Cech et de Miller et coll. - firent d'abord l'objet d'une communication faite a un colloque intitule: "L'analyse du discours assistee par ordinateur" et que j'avais organise en mars 1995. Ce colloque devait servir de reunion preliminaire a la table ronde sur le langage et la linguistique qui se tint a l'universite de Georgetown. Le quatrieme article qui a ete insere dans le Journal electronique de la communication fut redige par Kwang- Kuy Ko. Cet article nous parvint apres que nous eumes lance une demande d'articles, laquelle par la suite parut sur l'Internet.

Ces quatre articles font tous etat d'etudes empiriques sur le langage assiste par ordinateur. De plus, ces etudes posent des questions d'ordre pratique et mettent clairement en evidence les suites que pourraient avoir l'usage possible de la communication assistee par ordinateur dans un cadre formatif, les prises de positions dans les organismes d'Etat, la traduction par machine et la situation des langues, a l'exclusion de l'anglais, sur l'Internet. La s'arretent cependant leurs ressemblances. Chaque article constitue une analyse d'un type different de communication assistee par ordinateur - bavardage synchrone dans un milieu naturel et experimental, enregistrement asynchrone a un << newsgroup USENET>>, retransmission vocale assistee par ordinateur. Chaque article, d'une facon frappante, aborde diversement l'analyse du discours. Dans son analyse linguistique du texte, Ko analyse la repartition des reperes grammaticaux et lexicaux dans un corpus assite par ordinateur en vue de resituer la communication synchrone assistee par ordinateur par rapport au langage ecrit et parle. Condon et Chech, psycholinguistes, se preoccupent avant tout du traitement du discours axe sur les differences entre la negociation face-a-face et la negociation assistee par ordinateur des taches decisionnelles. Miller, LuperFoy, Kim et Duff font de la recherche dans le domaine de l'interface homme-ordinateur. Ils sont en train de mettre au point un module de discours pour la gestion du dialogue dans un systeme de machine a traduire. Enfin, Paollilo, dans sa propre optique sociolinguistique, nous donne une analyse d'echange de codes culturels dans un groupe Usenet bilingue. Bien que ce recueil ne soit pas volumineux et qu'il ne contienne pas toutes les methodes d'analyse du discours, il nous offre neanmoins une bonne idee des diversites theoriques et methodologiques que l'on trouve dans l'etude de l'usage du langage et de l'utilite de ces memes methodes pour l'etude du langage assistee par ordinateur.

Il vat sans dire que ce recueil n'est qu'une ebauche. Bien des questions concernant le langage assiste par ordinateur ne demandent pas mieux que d'etre posees d'autant plus que les techniques de la communication assistees par ordinateur evoluent pour permettrent la multiplication des modes de transmission des messages. D'autres methodes d'analyse du langage tirees - de l'analyse du discours, de la sociolinguistique, des corpus linguistiques et d'ailleurs-pourront a l'avenir etre appliquees aux donnees assistees par ordinateur. Elles fourniront des resultats prometteurs et des connaissances nouvelles que l'on ne peut qu'imaginer a present.

Nous tenons a remercier les personnes suivantes qui ont mis leur immense talent professionnel au service de ce numero: les auteurs de cet article, les 18 critiques anonymes et la redactrice du EJC/REC Teresa Harrison.


Susan Herring
Programme en linguistique
Universite du Texas
Arlington, TX 76019 EUA

Telephone. (817)272-3233
Telecopie. (817)272-2731
Courrier electronique.


Kwang-Kyu Ko
Kaya University, South Korea

Abstract. This study investigates the structural characteristics of computer-mediated language by comparing one form of synchronous computer-mediated communication (CMC), Daedalus InterChange, with analogous spoken and written corpora. The analysis focuses on 28 linguistic features claimed in previous research to charac- terize prototypical attributes of speaking and writing. Each feature was examined and quantified to determine the structural characteristics of InterChange in comparison with the two other modes.

Three distinctive feature occurrence patterns emerge as a result of the analysis. In the first pattern, the linguistic features of InterChange occur with higher frequency than in written dis- course, but lower than in spoken. This occurrence pattern reflects a general tendency for InterChange to pattern like spoken language, offset to varying degrees by written-like constraints on the medium. In the second pattern, linguistic features occur with higher frequency in InterChange than in either spoken or written discourse. This pattern is claimed to be the result of users compensating linguistically for electronically-determined communicative constraints, especially the lack of turn-taking and interactional cues. In the third pattern, linguistic features occur less often in InterChange than in either spoken or written discourse. The lower occurrence of these features, which tend to be associated with elaborateness in writing, is analyzed as a consequence of the heavy processing burden placed on InterChange users, who are under both physical demands imposed by the need to type, and cognitive demands imposed by the real- time communication situation.

These results reveal that the InterChange discourse mode is not merely intermediate between (or a "combination of") speaking and writing; rather the electronic medium uniquely fosters some behaviors and inhibits others, in support of the view that the physical mode of communication shapes language use.

LES ASPECTS STRUCTURAUX DU LANGAGE ASSISTE PAR ORDINATEUR: UNE ANALYSE COMPARATIVE DU DISCOURS D'ECHANGE. L'auteur de cette etude explore les aspects structuraux du langage assiste par ordinateur en confrontant une forme de la communication synchrone assistee par ordinateur, I'Echange Dedale, et des corpus ecrits et parles comparables. Cette analyse se circonscrit autour de 21 traits linguistiques dont on pretend, dans des recherches precedentes, qu'ils representent les attributs originaux du parle et de l'ecrit. On a etudie chaque trait et on l'a quantifie pour pouvoir determiner les caracteristiques structurales de l'Echange en les comparant aux deux autres modes.

Cette analyse revele des ensembles d'occurences de traits distinctifs. Dans le premier ensemble des traits linguistiques de l'Echange se retrouvent plus frequemment que dans le discours ecrit mais moins souvent que dans le discours parle. Cet ensemble d'occurences montre que l'Echange tend a prendre pour modele le langage parle, les contraintes du type ecrit sur le support contrebalancant a des degres divers cette tendance. Dans le deuxieme ensemble des traits linguistiques se retrouvent plus frequemment dans l'Echange que dans le discours ecrit ou parle. On pretend que ces formes resultent du besoin qu'eprouvent les usagers a chercher a compenser linguistiquement les contraintes communicatives, determinees electroniquement, surtout le manque d'alternance et de signaux d'interaction. Dans le troisieme ensemble les traits linguistiques se retrouvent moins souvent dans l'Echange que dans le discours ecrit et parle. D'apres notre analyse la faible frequence d'occurences de ces traits, liee a la complexite de l'ecrit, resulte des imperatifs de traitement imposes aux usagers de l'Echange, ces memes usagers subissant les taches astreignantes de dactylographier et les exigences cognitives imposees par les situations de communication en temps reel.

Ces resultats revelent que le mode de discours de l'Echange est plus qu'un moyen intermediaire entre l'ecrit et le parle ou meme plus qu'une synthese des deux; c'est plutot un moyen electronique unique qui tour a tour forme des habitudes et en entrave d'autres, ce qui prouve bien que les modes physiques de communication donne forme a l'emploi du langage.


Sherri L. Condon
University of Southwestern Louisiana

Claude G. Cech
University of Southwestern Louisiana

Abstract. This article compares discourse management strategies in face-to-face and computer-mediated interactions involving four decision-making tasks. A schema-based approach to discourse processing is adopted which claims that participants will employ the same decision- making routine in both modalities. However, due to differing constraints in the two modalities, we predict that management strategies should differ across modality. In particular, the greater effort and attentional demands of computer-mediated communication suggest that users will attempt to find more efficient ways of communicating.

We examine these issues in qualitative and quantitative analyses of the data using an utterance-unit coding system to identify discourse functions. The analyses show that participants in computer-mediated interaction encode discourse management functions more explicitly than those in face-to-face interactions. In addition, there is a clear preference for encoding management functions as first pair-parts of adjacency pairs, which results in utterances that manage turn- taking as well. The results suggest that participants in electronic communications compensate for decreased efficiency by adopting management strategies that pack more information into fewer utterances, i.e., by relying heavily on the implicit knowledge of a shared problem-solving schema.

STRATEGIES DE GESTION DU DISCOURS DANS DES INTERACTIONS DECISIONNELLES FACE-A-FACE ET ASSISTEES PAR ORDINATEUR. Cet article confronte les strategies de gestion du discours dans des interactions face-a-face et assistees par ordinateur impliquant quatre taches decisionnelles. On a recours a un procede schematique pour expliciter le processus de discours par lequel on pretend que les participants utiliseront les memes routines decisionnelles dans les deux modalites. Cependant, en raison de contraintes differentes dans les deux modalites, nous envisageons des divergences de strategies de gestion d'une modalite a l'autre. En particulier, l'effort soutenu et l'attention qu'exige la communication assistee par ordinateur ne manqueront pas d'inciter les usagers a essayer de trouver des moyens de communication plus efficaces.

Afin d'identifier les fonctions du discours, nous examinons ces problemes par le recours a une analyse qualitative et quantitative des donnees en nous servant d'un systeme de codage d'unites d'enonces. Ces analyses demontrent que ceux qui participaient a des interactions assistees par ordinateur encodaient plus explicitement les fonctions du systeme de discours que ceux qui prenaient part a des interactions face-a-face. De plus on constate une preference nette pour les fonctions de gestion d'encodage en tant que parties assorties initiales provenant des paires contigues d'ou ressortent des enonces qui gerent egalement l'alternance. Les resultats semblent indiquer que ceux qui prennent part a des communications electroniques adoptent des strategies de gestion qui permettent d'emmagasiner davantage d'informations dans un nombre plus restreint d'enonces pour compenser leur inefficacite croissante, par exemple, en se fiant beaucoup a la connaissance implicite d'un schema de resolution de problemes partagee.


Keith Miller
Language Analysis Systems and Georgetown University

Susann LuperFoy
MITRE Corporation and Georgetown University

Esther Kim
Massachusetts Institute of Technology

David Duff
MITRE Corporation

Abstract. The empirical study reported on here is an effort to extract design constraints for the dialogue manager for a complex genre of computer- mediated communication: real-time, spoken language dialogue between two telephone conversants speaking two different languages in a voice-only exchange. This family of applications for bilingual spoken communication is termed the interpreting telephone (IT). We sought to discover desiderata for the discourse module of such a system, abstracting away from all aspects of the problem other than those related to discourse processing. To simulate a zero computational cost for machine translation and speech processing, a "Wizard of Oz" study was designed. All input and output language was in the native language of the wizard, so that "translation" was from English to English.

Even with the cost of all other computation reduced to near zero, lengthy delays entailed by half-duplex message transmission and the absence of system status indicators caused users to become impatient and easily distracted by other activities, and to lose track of whose turn it was to speak. This article describes the data collection procedure and our analysis of the discourse results, including the discovery of several inadequacies of the standard system design for interpreting telephone systems. We conclude by proposing a design for a multi-modal system to address these inadequacies.

GESTION D'UN DIALOGUE BILINGUE ORAL ASSISTE PAR ORDINATEUR. L'etude empirique exposee dans cet article traduit une tentative d'obtention de contraintes d'etude pour le gestionnaire de dialogues en vue d'etablir un genre complexe de communication assistee par ordinateur: temps reel, dialogue en langage parle entre deux correspondants parlant deux langues differentes dans un echange vocal. On appelle cet ensemble d'applications pour une communication parlee bilingue le telephone-interprete (TI). Nous avons cherche a decouvrir les exigences necessaires a la mise en place du module de discours d'un tel systeme en nous distanciant de tout aspect du probleme autre que ceux relatifs au traitement du discours. Afin de simuler un cout computationnel zero pour la traduction par machine et le traitement du discours, on a mis au point une etude du type "Magicien d'Oz". Toutes les entrees et les sorties de langage se sont operees dans la langue maternelle du Magicien, ce qui fait que la "traduction" s'est faite de l'anglais en anglais.

Meme lorsque le cout de tout autre calcul a ete ramene a zero, la transmission de messages bidirectionnels a l'alternat et l'absence d'indicateurs d'etat de systeme ont rendu les usagers impatients, les ont distraits d'autres activites et leur ont fait oublier a qui etait le tour de parler. Cet article se donne pour tache de relever les donnees et de decrire notre analyse des resultats du discours y inclus la decouverte de plusieurs defauts dans la conception du systeme normalise, utilise pour interpreter les systemes de telephone. En conclusion, nous proposons un systeme multimodal afin de remedier a ces insuffisances.


John C. Paolillo
University of Texas at Arlington

Abstract. This article examines factors influencing language choice on the Usenet newsgroup soc.culture.punjab, a forum chartered for discussion of the culture of the Punjab region of India and Pakistan. English and Punjabi are both used on soc.culture.punjab, although English is statistically predominant, and the majority of Punjabi words are isolated borrowings occurring in otherwise English messages. The results of a functional analysis of code-switching reveal that Punjabi is used for marked discourse functions (often negatively), and only with interlocutors who are Punjabi community members. This limited usage is accounted for in terms of four factors which disfavor Punjabi use: inter-generational language shift, cultural ambivalence among expatriates, the prestige status of English in South Asia, and the predominance of English on the Internet.

LE CHOIX DE LANGUE SUR SOC.CULTURE.PUNJAB. L'auteur de cet article examine les facteurs determinants dans le choix d'une langue sur Newsgroup USENET, Soc.Culture.Punjab, une tribune organisee sur le sujet de la culture au Panjab indien et pakistanais. On parle l'anglais ainsi que le panjabi sur le Soc.Culture.Punjab quoique l'anglais domine largement, et la plupart des messages sont dans l'ensemble en anglais parsemes de mots empruntes a la langue panjabi. Les resultats d'une etude fonctionnelle de commutation de codes revelent que la langue panjabi est utilisee pour des fonctions de discours marque (souvent dans un sens defavorable) et seulement avec des interlocuteurs panjabi, membres de leur propre communaute. Quatre elements qui decouragent l'emploi du panjabi expliquent l'usage limite de cette langue: permutation langagiere d'une generation a l'autre, sentiments culturels contradictoires parmi les expatries, prestige de la langue anglaise dans le Sud de l'Asie et la predominance de l'anglais sur l'Internet.

Copyright 1996
Communication Institute for Online Scholarship, Inc.