Cantata-race op poleposition

Reading time: 5 minutes

Author:

De deelnemers van de Cantata-race kunnen van start. Het consortium voor het ontwikkelen van content-aware-systemen heeft de eerste plaats in de eerste Point-One-subsidietender in de wacht gesleept. Nu gaan Nederlandse bedrijven en universiteiten gezamenlijk hun zelfbewuste producten marktklaar proberen te maken. Want beeldverwerking is hot.

Een doorsnee televisietoestel heeft geen enkel benul van het soort programma dat hij aan het vertonen is. Het is hem om het even of het een documentaire, nieuwsprogramma of reclameblok is. Alleen de Ambilight-tv van Philips kijkt al wel een beetje naar zichzelf en past de achtergrondverlichting er bij aan. Dat is een primitieve vorm van content-awareness.

In de professionele wereld zijn er al meer ingewikkelde toepassingen van beeldverwerking te vinden. Dat komt omdat er meer geld te besteden valt. Zo zijn er al speciale camera‘s die gezichten herkennen. Beveiligingsfirma‘s doen waarschijnlijk een moord voor betrouwbare systemen die dat kunnen. Ook in de medische wereld zijn er opties genoeg. Er wordt al geëxperimenteerd met dokters van bits en silicium: camera‘s die een diagnose stellen door beelden van de patiënt te analyseren.

Het Cantata-race-project heeft als doel om in deze trends een flinke stap voorwaarts te maken en content-aware producten dichter naar de markt te brengen. De nieuwe kansen op dit gebied die aan het ontstaan zijn, mogen niet aan Europa en Nederland voorbij gaan. Deze nieuwe tak van sport binnen de hightech industrie zal weer de nodige hoogwaardige werkgelegenheid opleveren.

Een VCA-algoritme bepaalt waar het gras in de foto (links) zit en zet het resultaat in een zwart-witte kaart (midden), waarin zwart geen gras betekent en wit juist wel. Met een kleurcorrectie is het gras rechts een stuk groener. 

De ’Race‘ is de Nederlandse versie van het Europese Cantata-project. Er is wat overlap, maar een groot verschil is dat de Race-versie zich behalve op software ook op hardware richt. De Europese variant is op zijn beurt voortgekomen uit het Candela-project dat zo‘n vier jaar geleden tot stand kwam. Bosch Security Systems heeft binnen dat project het initiatief genomen beeldherkenning in een breder perspectief te gaan onderzoeken. Philips Medical Systems, Philips Research en de Technische Universiteit Eindhoven sloten zich daar bij aan.

In de zomer van 2005 kreeg het Candela-project in Helsinki een zeer succesvolle review. Met verschillende demonstraties toonden de deelnemers nieuwe vormen van content awareness. Desalniettemin heeft Video Content Analyse (VCA) nog een lange weg te gaan voordat een embedded systeem een volledige interpretatie van een scène kan doen.

Natuurlijk riepen de resultaten weer nieuwe vragen op. Als je een ’slimme camera‘ wilt verkopen, hoe garandeer je dan tegenover je klanten dat het ook echt werkt? Is er zoiets als het IQ van een camera? Zo nee, hoe valt dat dan te definiëren?

Reden genoeg dus om een vervolgonderzoek op poten te zetten. Cantata-race gaat verder waar Candela gebleven was. Op Europees niveau was de financiering snel geregeld, maar in Nederland bleek het nog een hele toer om het geld bij elkaar te schrapen. Voor de regeling Internationale Samenwerking werd het project afgewezen omdat de materie zich niet goed liet uitleggen tussen de agrarische en biochemische onderzoeken.

De Point-One-subsidieregeling voor nano-elektronica en embedded systemen was dus een geschenk uit de hemel. Bij de eerste tender voor embedded systemen kwam Cantata-race als eerste uit de bus. Het consortium van LogicaCMG, Philips Consumer Electronics, Philips Medical Systems, Philips Research, Prodrive, de TU Eindhoven en VDG Security kan aan de slag. Bosch Security Systems trok zich enkele maanden geleden terug. Met het project is 11,5 miljoen euro gemoeid, waarvan meer dan vier miljoen subsidie.

Fris groen gras

Een belangrijk resultaat van het Candela-project is dat VCA-analyse op verschillende niveaus gebeurt. Een surveillancecamera herkent bijvoorbeeld een bewegende auto op pixelniveau. De kleur- en textuuranalyse levert vervolgens op objectniveau informatie over het type auto op. In de scène, ten slotte, zijn zaken als positie en snelheid vast te leggen.

We gaan ons ook concentreren op het dynamisch gedrag van objecten. Daarmee kunnen we namelijk de beeldherkenning verbeteren. We hebben dan wel modellen van zowel starre objecten (auto‘s, fietsen) als deformeerbare objecten (mensen, dieren) nodig. Die gaan we dan ook maken.

Betrapt! De software ziet dat deze auto op een busbaan rijdt. 

Maar de objecten en hun modellen zijn niet altijd concrete voorwerpen of levende wezens. Het kan ook best gaan om een gazon in een park. In een tv-uitzending kan het content-aware-systeem dan het gras er extra groen en fris laten uitzien door een kleurcorrectie toe te passen.

Een speciaal aandachtsgebied waar we op ons gaan richten, is het ontwikkelen van efficiënte VCA-algoritmen voor medische toepassingen. We willen een lerend systeem maken dat we trainen met afbeeldingen. Daarmee kunnen we beelden van lichaamsdelen of afwijkend weefsel laten herkennen.

We willen daarnaast ook aansluiting zoeken bij bestaande trends. In toenemende mate zit de intelligentie van videosystemen in de camera‘s zelf, in plaats van in een centraal verwerkingspunt. Dat maakt het realiseren van geavanceerde toepassingen makkelijker. Denk bijvoorbeeld maar aan een camera die een object aan het volgen is en dat overdraagt aan een andere camera zodra het object uit beeld verdwijnt.

Wij gaan hieraan bijdragen door software-IP-blokken uit het videodomein als componenten beschikbaar te maken. Met name willen we de koppeling van software middels netwerken bestuderen. In principe moet het aan het eind van het project mogelijk zijn om een voorbeeldtoepassing te programmeren met een verzameling van softwarecomponenten.

State of the art

Het Amerikaanse Objectvideo heeft al succes met zijn algoritmen voor videoanalyse. Het bedrijf is zelfs marktleider op VCA-gebied. De technologie die het in huis heeft, komt van de Amerikaanse overheid die het voor defensieve doeleinden had laten ontwikkelen. Objectvideo doet er nu zijn voordeel mee met embedded applicaties.

Objectvideo heeft de algoritmen afgebeeld op DSP‘s van Texas Instruments. Iedereen mag deze afbeelding via een licentieconstructie toepassen in zijn embedded systeem. De Amerikanen bieden verschillende varianten van deze bibliotheek waardoor een zekere mate van schaalbaarheid in systeemcomplexiteit ontstaat. Ook geeft dit de mogelijkheid voor klanten om voor relatief weinig geld beeldanalyse aan hun systeem toe te voegen.

Intelligente camerasystemen hebben interessante toepassingen in de beveiliging.

Objectvideo biedt tevens de mogelijkheid om het back-end van het systeem aan te passen. Volledige integratie in een huidig systeem is echter niet zo gemakkelijk. Dat komt door de tools die Objectvideo levert. Die hebben een specifieke interface die alleen vanuit back-endsoftware van Objectvideo kan worden gebruikt. Wat dat betreft schiet de huidige stand van techniek nog duidelijk te kort.

Gebruikmakende van de marktleidende technologie gaan we er met het Cantata-project dan ook voor zorgen dat Europa meer succesvol gaat worden in het toepassen van VCA-technologie in de markt. Naast de toegankelijkheid tot deze technologie door de vele partners zijn de eerder genoemde aspecten als content-aware, realtime en gedistribueerde signaalbewerking belangrijke bijdragen hiervoor. Content-awareness gaat state-of-the-art systemen opleveren die van grote economische waarde zullen blijken.

De auteurs en hun organisaties zijn allen betrokken bij het Cantata-race-project. Egbert Jaspers is consultant en directeur bij Vinotion. Hij nam het projectleiderstokje over van Paul Merkus die nu werkzaam is als program manager bij Philips Europartners. Rick Koeleman werkt als systeemarchitect bij VDG Security in Zoetermeer. Johan Lukkien is assistent-hoogleraar Informatica aan de TUE waar Peter de With als hoogleraar Elektrotechniek doceert. De With is ook principal consultant bij LogicaCMG.