Archiv für die Kategorie Uncategorized
…just answered: Where are the Semantic web incubators? Any thoughts on building an economic ecosystem for Semantic web to keep momentum enough to attract si
Veröffentlicht von dakoller in Uncategorized am 23. April 2012
My basic message is: as long as your startup wants to use semantic tools/infrastructures (vs. providing tools and infrastructures) you likely not need a specific incubator, as semantic web just influences the tech part of your startup.
Semantic Web: Where are the Semantic web incubators? Any thoughts on building an economic ecosystem for Semantic web to keep momentum enough to attract sizable investment? 1 answer on Quora
Neue Inhalte
Veröffentlicht von dakoller in data science, Uncategorized am 22. März 2012
Unter Dienstleistungen und Produkte findet Ihr jetzt auf diesem Blog mein Angebot zum Thema Data Science.
Was macht eigentlich ein Data Scientist?
Veröffentlicht von dakoller in data science, Uncategorized am 5. Dezember 2011
In diesem Blog geht es darum zu klären, was hinter der Bezeichnung Data Scientist steckt, die in den USA bereits am stärksten präsent ist, aber auch im Rest der Welt an Bedeutung gewinnt.
Der Data Scientist beschäftigt sich mit der Beschaffung, Auswertung, Interpretation und Visualisierung von Informationen, die entweder innerhalb von Organisationen/Unternehmen entstehen oder die für sie relevant sind.
Die Geburtstunde der Data Science ist nicht klar festgelegt: eine der frühesten industriellen Anwendungen ist das “Kunden, die diesen Artikel gekauft haben, kauften auch …” Feature von Amazon: das habt Amazon geholfen, Kunden die eigentlich nur einen Artikel kaufen wollten, zwei oder mehr Artikel zu verkaufen.
Warum kommt dieses Thema jetzt?
Bei dem Begriff Data Scientist kommen zwei Entwicklungen zusammen, die jetzt in Kombination für – sagen wir mindestens mittlere und große Unternehmen relevant sind.
Zum einen kommen aus den Tools, die wir nutzen, eine immer größere Informationsmenge: denken Sie zum Beispiel an die Informationen, die hinter einem Klick auf einen Facebook “I like”- Knopf stehen können. Das sind
- die Informationen über Sie als Nutzer,
- ds Objekt, das Sie “mögen”,
- den Kontext des Klicks (wann klicken Sie, was haben Sie vor dem Klick gemacht und was danach), und
- in welchem Ausmaß Sie dabei mit Ihrem sozialen Netzwerk agieren.

Wozu braucht man den Data Scientist?
- Mustererkennung in Transaktionen,
- Zeitreihen-Betrachtungen, um z.B. saisonale Muster zu erkennen und
- Auswertungen, mit welcher Wahrscheinlichkeit ein bestimmtes Ereignis für eine Zielgruppe eintritt.
- Welche Artikel können zusammen angeboten und werden zusammen gekauft?
- Wieviele Schneeschaufeln müssen vorraussichtlich Ende Januar noch bestellt werden?
- Welches Verpackungsdesign spricht die Konsumenten am besten an?
- aus den ihnen zur Verfügung stehenden Daten (ggf. mit Berücksichtigung freier Daten von Behörden und Regierungen)
- Fragen zu formulieren, die den Einfluss auf das eigene Geschäft abbilden,
- diese Fragen mit einem Methoden- und IT-Werkzeugkasten zu beantworten und ggf.
- die Ergebnisse zu visualisieren, so dass ein Unternehmensvorstand daraus Handlungsempfehlungen entnehmen kann.
Was muss der Data Scientist können?
- Er muss zuhören & beschreiben können, wo der Schmerzpunkt des Kunden genau liegt, um herausfinden, welche Fragestellungen für eine Projekt am schnellsten zu Handlungsempfehlungen führen und welche Daten man dafür nutzen kann.
- Er muss das mathematische & statistische Handwerkszeug beherrschen und Algorithmen entwickeln, um keine Zeit beim Ausprobieren untauglicher Methoden zu verlieren.
- Er muss die IT-Werkzeuge so gut beherrschen, dass er sie schnell in den Prozess einbauen kann, der für die Lösung des Problem gebraucht wird. (Die Integration aller Werkzeuge heute noch eine manuelle Aufgabe für den Auswertenden ist)
Das kann man noch mit ein paar knackigen Anforderungen beschreiben:
In diesem Blog geht es darum zu klären, was hinter der Bezeichnung Data Scientist steckt, die in den USA bereits am stärksten präsent ist, aber auch im Rest der Welt an Bedeutung gewinnt.
Der Data Scientist beschäftigt sich mit der Beschaffung, Auswertung, Interpretation und Visualisierung von Informationen, die entweder innerhalb von Organisationen/Unternehmen entstehen oder die für sie relevant sind.
Die Geburtstunde der Data Science ist nicht klar festgelegt: eine der frühesten industriellen Anwendungen ist das “Kunden, die diesen Artikel gekauft haben, kauften auch …” Feature von Amazon: das habt Amazon geholfen, Kunden die eigentlich nur einen Artikel kaufen wollten, zwei oder mehr Artikel zu verkaufen.
Warum kommt dieses Thema jetzt?
Bei dem Begriff Data Scientist kommen zwei Entwicklungen zusammen, die jetzt in Kombination für – sagen wir mindestens mittlere und große Unternehmen relevant sind.
Zum einen kommen aus den Tools, die wir nutzen, eine immer größere Informationsmenge: denken Sie zum Beispiel an die Informationen, die hinter einem Klick auf einen Facebook “I like”- Knopf stehen können. Das sind
- die Informationen über Sie als Nutzer,
- ds Objekt, das Sie “mögen”,
- den Kontext des Klicks (wann klicken Sie, was haben Sie vor dem Klick gemacht und was danach), und
- in welchem Ausmaß Sie dabei mit Ihrem sozialen Netzwerk agieren.
(Mehr zum technischen Hintergrund des “I Like” gibt es in der https://developers.facebook.com/docs/reference/plugins/like/ ).

Wozu braucht man den Data Scientist?
- Mustererkennung in Transaktionen,
- Zeitreihen-Betrachtungen, um z.B. saisonale Muster zu erkennen und
- Auswertungen, mit welcher Wahrscheinlichkeit ein bestimmtes Ereignis für eine Zielgruppe eintritt.
- Welche Artikel können zusammen angeboten und werden zusammen gekauft?
- Wieviele Schneeschaufeln müssen vorraussichtlich Ende Januar noch bestellt werden?
- Welches Verpackungsdesign spricht die Konsumenten am besten an?
- aus den ihnen zur Verfügung stehenden Daten (ggf. mit Berücksichtigung freier Daten von Behörden und Regierungen)
- Fragen zu formulieren, die den Einfluss auf das eigene Geschäft abbilden,
- diese Fragen mit einem Methoden- und IT-Werkzeugkasten zu beantworten und ggf.
- die Ergebnisse zu visualisieren, so dass ein Unternehmensvorstand daraus Handlungsempfehlungen entnehmen kann.
Was muss der Data Scientist können?
- Er muss zuhören & beschreiben können, wo der Schmerzpunkt des Kunden genau liegt, um herausfinden, welche Fragestellungen für eine Projekt am schnellsten zu Handlungsempfehlungen führen und welche Daten man dafür nutzen kann.
- Er muss das mathematische & statistische Handwerkszeug beherrschen und Algorithmen entwickeln, um keine Zeit beim Ausprobieren untauglicher Methoden zu verlieren.
- Er muss die IT-Werkzeuge so gut beherrschen, dass er sie schnell in den Prozess einbauen kann, der für die Lösung des Problem gebraucht wird. (Die Integration aller Werkzeuge heute noch eine manuelle Aufgabe für den Auswertenden ist)
- Aus der Unternehmensberatung: Workshops durchführen, Projekt-Scope festlegen können, Anforderungsanalyse (und ggf. -priorisierung) durchführen, Meilensteine und Endergebnisse definieren.
- Aus der Mathematik und Statistik: lineare, logarithmische und non-lineare Regression, Zeitreihenanalyse, Varianzanalyse, Faktoren- und Clusteranalyse, neuronale Netze und Korrespondenzanalyse (und noch viele mehr)
- Aus dem IT-Bereich: Statistische Tools wie R,SAS und/oder MATLAB, Machine Learning-Algorithmen und Tools, z.B. Apache Hadoop, Cloud-Infrastruktur-Kenntnisse, Tools zur Informationsmodellierung, Tools zur Visualisierung (z.B. ggplot, Processing.JS)
Angrenzende Gebiete
- Datenjournalismus: Dabei verwenden Journalisten Datenquellen mit ähnlichen Zielen wie Data Scientists mit der Öffentlichkeit als Zielgruppe, der Fokus liegt hierbei auf Informationsgewinnung aus öffentlichen Quellen (Web Scraping sei als relevanteste Anwendung genannt) und Visualisierung. Ich sehe dabei den Guardian in Grossbritannien als führend an, im deutschsprachigen Bereich ist auch die ZEIT in diesem Thema unterwegs.
- Open Data: Wenn Fragestellungen nicht allein mit den unternehmenseigenen Daten beantwortet werden, können Daten von Behörden und regierungen Ansatzpunkte liefern. In Deutschland läuft die entsprechende Bewegung unter dem Schlagwort Offene-daten.de , ein weiteres prominentes Beispiel ist data.gov.uk, das Angebot der britischen Regierung.
- Semantic Web/Linked Data: Das Semantic Web oder spezieller die Linked Data-Bewegung beschäftigt sich damit, Zusammenhänge zwischen Objekten in Form öffentlicher Ontologien zu beschreiben und so wiederverwendbar zu machen. Die Relevanz zum Thema Data Science ergibt sich aus der Tatsache, dass nicht immer statische Verfahren allein ausreichen, um Phänomene zu erklären, wenn sie kausal nicht herleitbar sind. Linked Data Quellen ermöglichen diese basierend auf technischen Standards in den Auswertungsprozess einzubeziehen. Linked Data tritt auch gemeinsam mit Open Data auf, das ganze heisst dann Linked Open Data.
Veröffentlicht von dakoller in Uncategorized am 8. November 2011
Nett: Kerkeling lehnt Griechenlandlösung ab (von titanic-magazin.de)
Veröffentlicht von dakoller in Uncategorized am 7. November 2011
Photo from “Visual Complexity” from Manuel Lima: good overview with good illustrations
Review of the DreamForce event in Munich
Veröffentlicht von dakoller in Uncategorized am 7. November 2011
I attended the DreamForce event in Munich on 27th of October, which was acclaimed to be the biggest cloud event in Europe: I am not sure of that, but it was very worthwile experience.
My main intention was to evaluate how the well-known backend applications for e.g. CRM from SalesForce can be connected with applications running on the Heroku PaaS infrastructure, which was acquired by SalesForce. (The background of this is that I am currently looking into business ideas, which can form the basis of startup)
First of all they had a keynote of Hans-Dietrich Genscher, a former german minister of foreign affairs (next to other offices he held): initally I was not completely sure what he can/could tell the audience, but it was a very focused & motivating keynote with some humorous sidenotes. You can see the keynote below:
Regarding my main intention: there seems at the moment not to be an integration between Heroku PaaS and the SalesForce apps. The main answer was all the time that you can make use of the (very good) API of SalesForce from e.g. an Heroku application.
I think especially from a startup perspective there would be a good value add, when you can focus on the design & functionality of your customer-focussing services while the business processes (mainly CRM and Service relevant here) are managed by a mature application in the backend.
When I used my demo account on SalesForce I was very fond of the Chatter functionality: perhaps easiest explained as social networking enabled message bus for enterprises, which brings employees, business objects and business processes together in a nice Web 2.0 enabled way: it is especially interesting as it left already the annoucement stage and it is already available. (Surprisingly the most participants said in a short survey that they have not seen/used Chatter until now)
From a technical point of view I liked very much the developers corner, which had technical talks during the whole day: not only from SalesForce people, but also consultants, who bring their own experience to to the table (e.g. like the people from Tquila)
A friend said before on Twitter, that at least last year he saw the event as a marketing only event: I have to admit that this is right when you look at most of the talks (they are just good at marketing), but I got also good ideas on how to look into the SalesForce user group: after all a well spent day.
P.S.
- The people from TQuila (@tquiladotcom ) have just opened their offices in Munich and are exploring demands/options for a Force.com user/developer group here.
Dev tools for oAuth implementation
Veröffentlicht von dakoller in Uncategorized am 7. November 2011
I had already quite the situation that I needed to call an #oAuth protected API for e.g. a web application, without having implemented the enduser facing oAuth-Transactions.
If you want to access Google APIs, you can use Google oAuth Playground (which was presented today) at http://googlecodesamples.com/oauth_playground/index.php .
Unfortunately this tool just serves Googles APIs, so I wanted to share the small code snippet I use to create access token for arbitrary APIs from the python command line:
import tweepy
CONSUMER_KEY = ‘paste your Consumer Key here’
CONSUMER_SECRET = ‘paste your Consumer Secret here’
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
auth_url = auth.get_authorization_url()
print ‘Please authorize: ’ + auth_url
verifier = raw_input(‘PIN: ‘).strip()
auth.get_access_token(verifier)
print “ACCESS_KEY = ‘%s’” % auth.access_token.key
print “ACCESS_SECRET = ‘%s’” % auth.access_token.secret
You can find the snippet also on Pastebin: http://pastebin.com/np7rip3b
Review von “Soldaten: Protokolle vom Kämpfen, Töten und Sterben”
Veröffentlicht von dakoller in Uncategorized am 15. Mai 2011

…ich bin grade mit diesem Buch fertig geworden, deshalb hier ein kurzer Review:
Worum geht es im Buch?
Sönke Neitzel hat in London eine neue Quelle für Erforschung des Innenlebens der deutschen Wehrmacht aufgemacht: das sind Abhörprotokolle in Gefangenschaft gegangener deutscher Soldaten.
Das besondere dieser Quelle ist, daß die Betroffenen (im Gegensatz zu zum Beispiel Feldpostbriefen) nicht primär entschuldigend/rechtfertigend an Dritte gerichtet sind, sondern eher “von Kamerad zu Kamerad” sprechen. (gegenüber denen man sich auch mit eigenen Leistungen brüsten möchte)
Was ist gut im Buch?
Die Archiv-Materialien werden in thematischen Blöcken gut übersichtlich aufgereiht: die Autoren gehen jeweils auf zeitliche Veränderungen und Einzelgruppen innerhalb der Gefangenen ein. Die Themenblöcke sind z.B. Gerüchte, Technik, Siegesglaube, Ideologie, aber auch “Spaß”, Jagd und “Versenken”.
Hilfreich sind die einleitenden Bemerkungen zur Methode der Referenzrahmen: das erweist sich als hilfreiche Methode, um die Vielschichtigkeit des Themas zu adressieren.
Positiv ist auch, dass nicht nur der isoliert der zweite Weltkrieg betrachtet wird, sondern dass weitere zeitliche Verbindungen (z.B. aus der Forschung zum Koreakrieg und zum Irakkrieg) mitaufgenommen werden.
Abschliessend gibt es auch erhellende Vergleiche zwischen den beteiligten Nationen.
Was kann besser sein?
Zum Teil geraten nach den Quellmaterialien die Textexegesen etwas langatmig: das hätte (manchmal) kürzer sein.
Abschliessend…
Ein sehr lesenwertes Buch mit zum Teil harten Materialien, das vor allem durch seine neue Perspektive auf neue Quellen auffällt.
Und hier ist das Buch auf Amazon.de.
Summary of DroidCon NFC-Session
Veröffentlicht von dakoller in Uncategorized am 23. März 2011
Today I attended a talk given on a recent Berlin #NFC project, where people used the new Google Nexus S to interact with NFC tags. (later today this will end in a “puzzle game”, which is only interesting to people with NFC enabled devices
I noted the following things from the talk:
- Development along the Android SDK docs is mostly straightforward: Tag recognition can be captured by an app using defined intents (one of the means to enable communication between apps in the android world)
- One of the backsides is that the developer has to think in detail which tech standard for NFC tags ghe wants to use: acccording to the speakers it was difficult, to provide a generic tag content handling.
- Reading out the contents of the new german (NFC-enabled) ID card is technically possible, but the content on the card is encrypted so -as of now- you cannot make much use of it.
- Reading NFC tags will be the most important usecase, but some do allow writing to them as well.
- Google Nexus S allows itself to be exposed as tag too: there was no api way shown, but android apparently delivers a mini-app for that.
- The speaker told the rumor that Sandisk investigates ways to expose sd-cards as NFC tags.
- Currently the only larger public use case is the “touch” option of the Deutsche Bahn, which enables you to get train tickets via NFC enabled devices.
During the presentation I thought of use cases of NFC: I see the mot potential in areas where read/write-able tags are required (to hold some kind of state information at a ertain location): read-only tags will imo not get so much traction, as putting up a QR code is (compared to that) a much cheaper deployment option. (…as of now with a much bigger device basis, as nearly every device can now recognize barcodes)
The project the speakers talked about was the NFC-Puzzle ( source at http://dev.c-base.org/nfc-puzzle ).
@tomayac: more you want to know? (try to get speakers twitter handle for giving it to you)
