I built a regex to match sentences in a PHP script, it works great though, it misses the first sentence. Here is the PHP including the regex.
preg_match_all('([A-Z][^\.!?]*[\.!?]\s)', '$data', $arr, PREG_OFFSET_CAPTURE);
The string used for testing.
Persoonsgegevens van 84.000 Bol.com-klanten waren toegankelijk via een
lek in de site van een externe partij waar Bol.com mee samenwerkte.
Het ging om een kwetsbaarheid voor sql-injectie. De gegevens zijn
volgens Bol.com niet misbruikt.De webwinkel heeft de getroffen klanten uit zichzelf geïnformeerd,
blijkt onder meer uit een topic op GoT. Het gaat om 84.000 klanten die
meededen aan de ‘kennismakingsactie’ Warm Welkom.De klantgegevens stonden in een database van een externe partij waar
Bol.com mee samenwerkte voor de actie, zegt Bol.com-directeur Daniel
Ropers tegenover Tweakers.net. Van de klanten konden naam, geslacht,
e-mailadres en geboortedatum worden achterhaald; betaalgegevens waren
niet toegankelijk.“We hebben gisteravond klanten geïnformeerd die eind vorig jaar hebben
meegedaan aan de marketingactie”, zegt Ropers. “Via het bureau dat de
actie heeft verzorgd waren gedurende een bepaalde periode gegevens
toegankelijk.” Het lek zou in ieder geval vorig jaar zomer al in de
software hebben gezeten. Sinds februari waren de gegevens versleuteld.
Volgens Webwereld gaat het om een lek in de tool amfphp.Bol.com ondernam actie nadat het bedrijf werd getipt. Ropers: “Buiten
de tipgever is er niemand bij de data geweest; er is niets uitgelekt.
We zijn de tipgever zeer dankbaar.” Hij benadrukt dat Bol.com zelf
niet is gehackt, maar zegt ook dat het bedrijf desondanks zijn
verantwoordelijkheid wil nemen. “Voor alle bedrijven waar we mee
samenwerken hebben we security-checklists. Daar moeten we dus een stap
verder in gaan.”
Source: Tweakers.net
I would use this regex to match sentence:
Add a bit more tweaks here and there gives a better looking output for the test input (test input only – no guarantee for general text):