Cassell und Vilhjálmsson (1999) beschäftigten sich damit, wie man das kommunikative Verhalten von Avataren in graphischen Chats verbessern kann. In aktuellen Chatsystemen, beklagen sie, kann der Nutzer zur gleichen Zeit entweder das Verhalten des Avatars steuern oder mit anderen Nutzern Nachrichten austauschen. Ist der Nutzer damit beschäftigt, Nachrichten einzutippen, stände die Avatare nur bewegungslos herum. Dies liefe der natürlichen Kommunikation zuwider, denn hier ist ein beachtlicher Teil non-verbale Kommunikation im Spiel.
Zwar könnten die Nutzer in den neuesten Systemen verschiedene Animationen oder emotionale Zustände aus einem Menü wählen, aber non-verbale Kommunikation sei oft spontan und der Nutzer zu beschäftigt, um das Verhalten seines Avatars zu kontrollieren.
Wäre es nicht wünschenswert, wenn Avatare autonom kommunikatives Verhalten zeigen würden, fragten sich Cassell und Vilhjálmsson. Hier stellt sich die Frage, was der Nutzer bevorzugt: direkte Manipulation oder Autonomie des Agenten.
Der Ansatz von Cassell und Vilhjálmsson betrachtet den Avatar als autonomen Agenten und wendet die Technik des envelope feedback (siehe Abschnitt 9) an. Allerdings ist die Autonomie auf eine Reihe von kommunikativen Ausdrücken des Gesichts und des Kopfes begrenzt. Der Nutzer hat weiterhin die Kontrolle über die Navigation und den Inhalt des Gespräches. Er behält gewissermaßen die Kontrolle auf einer höheren Ebene über das Verhalten des Avatars. Damit werden laut Cassell und Vilhjálmsson folgende Probleme angesprochen:
Für ihr Experiment benutzten Cassell und Vilhjálmsson ein 3D-Chat Programm namens BodyChat. In diesem Chat werden die Avatare als 3D-Modelle von Oberkörpern von cartoon-ähnlichen, menschlichen Figuren repräsentiert. Nutzer können ihre Avatare mittels Tasten navigieren, mit der Maus Kommando-Parameter eingeben und mit anderen Nutzern mittels Text kommunizieren. Dabei erscheinen die Worte des Sprechers oberhalb des Kopfes des Avatars. Es können sich nur jeweils zwei Personen miteinander unterhalten.
Das kommunikative Verhalten des Avatars hängt von den Intentionen des Nutzers ab. Diese kann der Nutzer über Kommando-Parameter beschreiben: er kann mitteilen, mit wem er sprechen möchte, ob er überhaupt gesprächsbereit ist oder ob er eine Gespräch beenden möchte. Aus diesen Intentionen generiert der Avatar dann autonomes Verhalten. Bei der Wiedergabe von Wörtern versucht der Avatar einen angemessenen Gesichtsausdruck zu machen, z.B. kann er das Wort ,,very`` durch ein leichtes Kopfnicken betonen.
Im wesentlichen wollten Cassell und Vilhjálmsson überprüfen, welche Effekte ein solcher autonomer Avatar auf den Nutzer eines graphischen Chats hat. Obwohl sie bereits die Vorzüge eines autonomen Avatars schilderten, haben sie doch auch Bedenken:
An dem Experiment nahmen 24 Probanden teil. Sie hatten Erfahrung mit textbasierten Chatsystemen, jedoch keine mit graphischen Chatsystemen. Ihnen wurde die Aufgabe gestellt, andere Nutzer im Chat zu treffen und so viel wie möglich übereinander herauszufinden.
In der Chatumgebung befanden sich vier verschiedene Nutzer (die jedoch alle von einem Experimentator gesteuert wurden). Es gab drei verschiedene Versionen von BodyChat, die sich bis auf folgendes nicht unterschieden:
Die Probanden konnten das System für 45 Minuten benutzen, dann mußten sie einen Fragebogen ausfüllen. Außerdem sollten sie alle Fakten, die sie über die anderen scheinbaren Nutzer erfahren hatten, auflisten. Das galt dann als Maß für die Aufgabenperformanz.
Die Gespräche in der autonomen Bedingung dauerten signifikant länger als in den anderen beiden Bedingungen. Laut Cassell und Vilhjálmsson könnte dies darauf hindeuten, daß die Probanden des autonomen Systems interessierter an der Kommunikation seien. Außerdem erinnerten sich in die Versuchspersonen der autonomen Version an mehr Fakten als in der sowohl-als-auch und in der manuellen Version (in dieser Reihenfolge). Dies könnte, so die Autoren, an erhöhtem Engagement der Probanden liegen, weil sie ihre Aufmerksamkeit nicht zwischen Kommunikation und Kontrolle des Avatars teilen mußten.
Cassell und Vilhjálmsson fragten die Probanden, wie natürlich sie das Verhalten des Avatars und die Interaktion fanden. Diese beiden zusammen zeigten, daß die Nutzer des autonomen Systems dieses als natürlicher beurteilten als die beiden anderen Systeme.
Die Probanden fanden außerdem, daß das autonome System expressiver war verglichen mit dem manuellen System, aber nicht signifikant expressiver als das sowohl-als-auch System. Dies weist darauf hin, so die Autoren, daß sich die Expressivität erhöht, wenn autonomes Verhalten generiert wird. Allerdings fanden die Nutzer des sowohl-als-auch Systems ihre Erfahrung langweiliger als die Nutzer des autonomen Systems.
Schließlich fanden die Probanden in der autonomen Bedingung, daß sie mehr Kontrolle über den Konversation hatten als die Probanden des sowohl-als-auch und des manuellen Systems (in dieser Reihenfolge). Mit diesem Ergebnis scheinen sich zwei Gegensätze (Kontrolle vs. Autonomie) zu vereinen.
Schließlich verglichen Cassell und Vilhjálmsson die autonome Bedingung mit der nichts Bedingung. Die autonome Bedingung wurde als signifikant natürlicher eingestuft als die nichts Bedingung. Aber es gab keinen Unterschied hinsichtlich der Expressivität und Kontrolle. Außerdem wurde die durchschnittliche Gesprächsdauer in der nichts Bedingung nur von der in der autonomen Bedingung übertroffen. Die Autoren sehen sich in ihrer Schlußfolgerung unterstützt, daß die Nutzer Kontrolle und Spaß primär dem Gespräch selber entnehmen und sich durch die Kontrolle des Verhaltens ihres Avatars abgelenkt fühlen.