Slides of R Intro Presentation

The Google Technology User Group in Munich asked me for a short presentation, what you can do with R tool & scripting language. …This is what I told them.

Using Shiny to create an interactive visualization: KlimaBiene

Together with Raimund Henneken from I worked on my first Shiny usecase, which you can see at .

Klimabiene focuses on the movements of bee swarms and using this platform scientists & bee friends can monitor when & where swarms of bees were seen.

The visualization of KlimaBiene is based on the R-interactive web apps framework Shiny. It consists of a data selector widget, a chart and a map visualization. The data are taken from klimabiene’s database of observations, which is accessed as a CSV file.

Another interesting aspect id that this project uses the beta stage hosting offering of the #RStudio people. You can either host your own R-Shiny-App (which means a amount of setup and configuration work, because you cannot use ‘standard’ hosting packages): for this situation the RStudio people are working on an easy to use hosting-offering, which I used for this project.

I’ll talk about about the lessons learned of this project at the next meetup of the R User group in Munich: the slides will be available at/after the talk.

Using django-social-auth with the XING api … oAuth in action!

This blog is about how to connect to the XING API via oAuth: my use case was to implement a “Login with XING” option in a web application.

XING is the european pendant to LinkedIn as social network for professionals, so there are bunch of people, who are using these two networks in order to maintain their connections ( might provide a helper for this challenge ) . Luckily for me, XING started with an API in closed beta state (signup at

My setup is a Django-based web application hosted on Heroku, and I am using the last stable version 1.4.1.

This blog is about what I needed to integrate with the app, how I adapted the connection and how I can use it now. Den Rest des Beitrags lesen »

Now also with blogs/lessons learned from

As you might be aware of, I am currently working on a startup called

RapidSlides creates 80% ready business presentations based on visual input. The input comes from photos of whiteboards / flip charts or hand-drawn sketches from your iPad. We use your layout or create one based on your website and deliver our results back to in max. 24  hours.

You want to see how it looks like? Just head over to , where you can see first examples from customer orders.


You can also participate in the currently running test phase: just sign up at .

We (that means  Ralf Westbrock from and me ) are operating from Munich Germany and follow the Lean Startup methodolody.

My role there is mainly the technical part and i’ll blog here about my lessons learned of the project. Do you have already specific aspects in which you are interested? Just comment here or reach out on Twitter at @dakoller .

REGISTRATION STARTED – 2. Data Science Day, August 22, Berlin

1. Data Science Day was a great event … so the next upcoming one is worth a visit too. The focus topic will be Game Analytics.

I heard rumors about an idea to got to Munich for one of the next Data Science Days… do you have any feedback ? Any special focus topics you think of?


Use social networks to serve more relevant people better (Business Ideas)

In the business ideas category I post potential business ideas, which I cannot work on the moment, but which may be good input to other people.

You might have seen the nice pic on Facebook, which said
“Please fix my phone or I will tell my X-thousands of followers about your bad performance’”.

This sounds like a joke at the moment, but in terms of customer relationship management you might fear the bad sentiment about your company, which is conveyed to a (potentially) very large group of people by messages like this one. You also might have heard already about the very positive impact on your brand, when you react on customer feedback in social online media in a very constructive, friendly & timely manner.

So not only in case of customer service tasks, but also for customer acquisition tasks you are interested in making influential people to talk about your product or service.

But how would the company know who is important/influential on social networks and in which peer groups their voice is heard best? There is a solution for that!

So the idea is:

Value Proposition:
Enable companies to put  special attention on influential people on social networks (among their customer & prospects).

This enables them to e.g.

  • distribute limited special goodies, (such as  beta invites, coupons etc.) to the people influential in their domain,
  • prioritize them in customer service applications or
  • approach them for feedback on your service.
You might even think of offering special treatment, when an influential person enters a chatbox on your website. (a kind of learning for me from 1. german data Science Day – a (german) review is available)

Match their customer information with data sources on influential people, e.g. based on the services of  Klout or PeerIndex.

(yes: there is sometimes bad sentiment about services like Klout, as they reduce a persons relevance to a single number – and they don’t tell you in detail, how they are doing it. This bad sentiment goes as far as motivating people to setup fake services such as I think these services learned from this feedback, e.g. to tell you also on which topics someone is influential.)

Many of these service, including the two mentioned ones, make their information available as APIs, so one could link this information with customer information.

This could go as far as: “Distribute 100 books coupons to the most important people in the area of ‘Rosamunde Pilcher’ literature in my customer list.”

Secret sauce: (important to not get immediately a victim of other people copying your service)

Companies wouldn’t want to do this kind of data wrangling from APIs and the merging with other data sources on their own. They likely also don’t want to invest the infrastructure, which is needed the keep this data current and to hint the company to relevant changes over time.

However, there is a caveat: you need a good story (or a list of precautions to show the companies, that you work with their data in a secure way)


1. Data Science Day in Deutschland: ein kurzer Review

Am 6.6. fand in Berlin der erste Data Science Day in Deutschland statt: organisiert hat ihn Klaas Bollhöfer (@klabol)… aber das war nicht die erste Aktion zum Thema: der Data Science Day war aber der erste Höhepunkt einer aktiven Communityarbeit (auf XING) seit Januar , die die dort mittlerweile 92 Mitglieder einbindet.

(Ein gutes Zeichen ist auch, daß mittlerweile auch deutsche Unternehmen die Relevanz offensichtlich verstanden haben, was man daran sehen kann, dass sie Mitarbeiter dort teilnehmen liessen und das Event auch gesponsert haben, z. B. @Immobilienscout, @Wooga)

Bedeutend ist, daß wir letzte Woche an einem Platz 70 Gäste da hatten, die den ziemlich breiten Raum des Begriffs Data Science ziemlich komplett ausgeleuchtet haben. (Vorher hatte ich hier manchmal das Gefühl, in einem sehr exotischen Feld zu arbeiten)

Die Bandbreite der Themen ging von
- Frameworks und Tools (z.B. Hadoop, Twitter Storm),
- Handling von strukturierter und unstrukturierter Information (z.B. bessere Suche, Inhaltsanalyse und Zusammenfassungen von Text mit den interessanten Übergängen ins Semantic Web) über
- die Relevanz von Open Data (als Basis für öffentliche Informationsangebote und aufrüttelnde Unterstützung für Kampagnen () bis hin zu
- Visualisierungen.(z.B. auf Basis von Processing).

Der Vormittag war gefüllt von gesetzten Präsentationen ( Agenda unter  : gut war, daß Klaas die so kurz halten konnte, daß viel Raum für Diskussionen blieb. Am Nachmittag ging es drei parallel laufenden und kleineren Gruppen um
- sehr technische Fragen, (“was macht man mit Twitter Storm?”),
- visionärere Themen (“was kann man noch mit XYZ machen?”) und
- eine Gruppe zum Thema Texthandling und Open Data-Nutzung.

Aus diesem Tag habe ich folgende Beobachtungen mitgenommen
- die meiste Relevanz hat das Thema Data Science im Moment wohl im Advertising-Markt: da geht es häufig, um sehr schnelle Antworten, die nicht irgendwann zu beantworten sind, sondern genau dann wenn der Webseiten-Besucher auf meiner Seite ist. (Auch wenn es für meinen ‘Traum’ von für mich sehr relevanter, weil auf meine Interessen zugeschnittene, Werbung wohl noch zu früh ist.)
- Kurz danach kommt das Thema von unstrukturierter Information: hier fällt mir auf, daß z.B. im Vergleich zu den USA (wo ich im Februar auf der StrataConf war) das Thema hier wichtiger zu sein scheint.
- Im Moment nutzen hauptsächlich junge und eher kleinere Unternehmen Kompetenz zu dem Thema Big Data/Data Science: in etablierten & größeren Unternehmen, die zwar die Daten hätten (die sich ein Startup ziemlich mühsam sehr beschaffen oder erzeugen muß), ist das Thema wohl noch nicht angekommen.
- Aus der Perspektive eines Startupgründers ist klar, daß aus eigenen Aktionen gewonnene Daten und Analysen essentiell (oder zumindest wichtig) für die Geschäftsentwicklung sind. Ein gutes Beispiel dafür sind die Münchner @10stamps (kurz eine App digitale Stempelkarten), die vermutlich mittlerweile mehr Überblick über meinen Kaffeekonsum als ich selbst haben.
- Das Thema Tools für BigData ist auch noch ein guter Platz, auf dem sich neue Startups ausprobieren können: hier haben für mich Ansätze die Nase vorne, die einem Analysten/Geschäftsentwickler die Tools selbst in die Hand geben, neue Einsichten zu gewinnen. (anstatt für jede neue Fragestellung einen Entwickler suchen zu müssen). Der nächste Entwicklungsschritt sind Tools, die dem Nutzer nicht mehr Zahlenwüsten (z.B. in Powerpoint-Form) vorsetzen, sondern (mutmasslich) neue Einsichten (wie Veränderungen in Mustern & Trends) direkt in die Hand geben.

Zusammengefasst: ein Tag voll von neuem Information und Diskussionen: der nächste Data Science Day findet in 3-4 Monaten statt und wird sich schwerpunktmässig mit dem Thema Analytics in Online-Games befassen.

