Data, Science & More

Leaving the field: becoming an extronomer

I wrote the post below roughly 5 years ago now. I quit my academic job in astrophysics, turned to industry and became a data scientist. I might at some point write something about how I think about all of this now.

I have decided to quit astronomy and start a job in the ‘real world’

I give up on a dream. I thoroughly enjoy doing astronomy. I have time left on my current contract and am even fairly confident that after this and another limited number of temporary jobs, I could have gotten a more permanent job in the field at some time, somewhere. So why quit? The uncertainty in a career in astronomy is enormous. If you don’t belong to the very top, and I don’t, you will have to go with the flow and move to wherever the field wants you. Sometimes that will get you to a very nice place in every respect (as we had in Baltimore), sometimes the place to work is very nice, but the place to live less so (like our current situation) and without a doubt even less desirable combinations are possible. Not the biggest deal for a short term postdoc (though too bad if it really doesn’t work out), but where will this long sought-after tenure-track job take you? And when?

Everybody who has done it for a while knows it: living far away from family and good friends is not easy. You can and will build up a new social life (if you even care about a social life, which you should), but those close at heart will be far. Too far, often. Our daughter deserves to grow up among the love of her grandparents and the rest of her family, just as well as they deserve to witness Amy growing up. It is a choice that everyone has to make for him-/herself, but for me a career in astronomy does not outweigh this aspect of life.

Contrary to (too) many academics, I believe that jobs outside of academia can be equally interesting. In many jobs, the everyday activities are even very similar to those of an astronomer. I think I have landed such a job. I will work in data science and business intelligence at a relatively small scale health insurance provider. An example of a project could be to detect fraud in their databases of claims, doctors, hospitals etc. (automatically). In my opinion, that is intellectually as challenging as the questions I am working on in astronomy, with the additional benefit that more people than just a handful of colleagues care about what you do.

Doing astronomy is fun. Like me, many colleagues often describe it as getting paid for your hobby. I can now go back to doing it purely as a hobby. There are several projects I will try to stay involved in to some extent, and I have a couple of very small projects in mind that I still can do. One doesn’t need to be a professional astronomer to do something fun and remotely useful. As an extronomer, you can easily be an amateur astrophysicist as well.

There are many aspects of working in astronomy that I will miss. The friendly atmosphere, collegiality and informality are a bless. I have met many great friends, with whom I hope to stay in contact. On the other hand, I am very much looking forward to my new profession and old environment. Even though I will leave the field professionally, at heart and in my way of thinking I will always be an astronomer.

Fraude detecteren door vernuftige analyse

(This is a blog published on the website of my employer, thought it would make a fair placeholder, sorry about the Dutch).

De zorg is al duur zat. Elke extra euro die moet worden uitgegeven omdat een zorgverlener de regels buigt moet achterhaald, of liever nog voorkomen worden. Probleem is dat “die euro” dan wel gevonden moet worden en dat is geen sinecure. Dit komt door enerzijds het enorme volume aan declaraties dat een zorgverzekeraar krijgt van alle zorgverleners bij elkaar en anderzijds het feit dat fraudeurs slimme dingen bedenken om vooral niet op te vallen. Hoe sporen we bij DSW fraudeurs op?

Op zoek naar outliers

Naast de meer traditionele manieren om fraude op te sporen gebruiken we bij DSW ook analysetechnieken om in de grote bergen data die we hebben patronen te ontdekken die zouden kunnen wijzen op frauduleus of ander onwenselijk gedrag. De tandarts die in een jaar 20 vullingen legt bij een familielid of de psychiater die 40 uur per dag zegt te werken is natuurlijk gauw gevonden, maar de meeste boeven pakken het toch slimmer aan. Precies daarom moeten wij nog slimmer zijn!


Voor het detecteren van rotte appels in een fruitmand vol zorgverleners gaan we er over het algemeen van uit dat de grote meerderheid zich niet misdraagt. Dit betekent dat we kunnen zoeken naar zogenaamde “outliers”, personen of instanties die zich net even anders lijken te gedragen dan de norm. Een complicerende factor is dat wij als zorgverzekeraar altijd maar een deel van het gedrag van een zorgverlener kunnen controleren, namelijk alleen de zorg die gedeclareerd wordt voor die patiënten die toevallig bij ons verzekerd zijn. Bij sommige instanties is dat misschien wel 60% van de populatie of meer, maar bij de meesten toch duidelijk minder, en we weten niet eens hoeveel precies. We hebben dus eerst wat werk te verzetten om analyses te doen op grootheden die niet zo gevoelig zijn voor het marktaandeel van DSW, zoals bijvoorbeeld kosten per verzekerde.

 

De score opbouwen

Alleen controleren op een getal als de gemiddelde kosten per verzekerde dekt de lading ook niet. Als een kwaadwillende zorgverlener dan kleine bedragen declareert voor een hoop mensen, dan gaat hij zelfs lager eindigen in kosten per verzekerde (terwijl hij in het aantal mensen waarvoor iets declareert juist weer zou opvallen). We kijken daarom naar heel veel van dit soort graadmeters tegelijk. Zo bouwen we een “score” op die aangeeft op hoeveel van dit soort anomaliedetecties (en andere controles) een zorgverlener opvalt, en hoe sterk hij opvalt.

Naast het detecteren van grootheden waarop een zorgverlener opvalt door ander gedrag dan zijn/haar concurrenten, kunnen we ook kijken naar signalen van verzekerden (“ik heb die behandeling helemaal niet gehad”), naar simpele regels als “geamputeerde ledematen kun je niet meer breken” of zelfs naar (zakelijke) verbanden tussen verschillende zorgverleners waardoor lucratieve doch frauduleuze werkwijzen kunnen worden overgebracht van de doorgewinterde oplichter naar de crimineel in spe.

Verder onderzoek

Alle ingrediënten van een totaalscore zijn hard te maken met statistiek, wet- en regelgeving of andere afspraken. Door het tweaken van de opbouw van zo’n totaalscore maken we een lijst waarvan we toch met enige zekerheid wel kunnen zeggen dat er iets loos is. Wanneer dergelijke signalen zijn gegenereerd dan pakken andere afdelingen dit doorgaans op voor verder onderzoek. Hiervoor levert ons datateam uiteraard nog wel data en analyses aan, maar het initiatief voor het uiteindelijk aanpakken ligt dan in de handen van de afdelingen die dichter bij de dagelijkse gang van zaken van een zorgverlener staan.