Hallo zusammen,
ich bin derzeit an einem Programm dran, welches verschiedene Tweets (Twitter-Beiträge) erhält und diese weiterverarbeitet.
Derzeit geht es um reine Textverarbeitung, d.h. ich bekomme Strings wie z.B. diese:
RT @wimrampen: RT @sly Keynote by @designthinkers at the #iak10 "building a Culture of Trust" http://tinyurl.com/3694sac #servicedesign
User experience design, service design & design thinking : A common story ?: #iak10 UX design, service design http://url4.eu/3ZYGI
Ich möchte nun gerne die Links erkennen und diese durch den Text "LINK" ersetzen.
Mit dem Regex "(http|www).*($|\\s)" erkenne ich zwar die Links, aber es gibt noch ein weiteres Problem. Im ersten String soll es nach dem Link weitergehen. Derzeit würde der Rest des Satzes noch mit abgeschnitten. Auf der anderen Seite muss, wie es die jetzige Variante tut, auch abgeschnitten werden, wenn es nach dem Link nicht mehr weiter geht (daher \s für Whitespaces).
Ich bekomme es jedoch auf Biegen und Brechen nicht hin, dass beim 1. String nur bis zu einem (optionalen) Leerzeichen getrennt wird.
Ich bin über jeden hilfreichen Vorschlag dankbar.
Gruß
stamps
ich bin derzeit an einem Programm dran, welches verschiedene Tweets (Twitter-Beiträge) erhält und diese weiterverarbeitet.
Derzeit geht es um reine Textverarbeitung, d.h. ich bekomme Strings wie z.B. diese:
RT @wimrampen: RT @sly Keynote by @designthinkers at the #iak10 "building a Culture of Trust" http://tinyurl.com/3694sac #servicedesign
User experience design, service design & design thinking : A common story ?: #iak10 UX design, service design http://url4.eu/3ZYGI
Ich möchte nun gerne die Links erkennen und diese durch den Text "LINK" ersetzen.
Mit dem Regex "(http|www).*($|\\s)" erkenne ich zwar die Links, aber es gibt noch ein weiteres Problem. Im ersten String soll es nach dem Link weitergehen. Derzeit würde der Rest des Satzes noch mit abgeschnitten. Auf der anderen Seite muss, wie es die jetzige Variante tut, auch abgeschnitten werden, wenn es nach dem Link nicht mehr weiter geht (daher \s für Whitespaces).
Ich bekomme es jedoch auf Biegen und Brechen nicht hin, dass beim 1. String nur bis zu einem (optionalen) Leerzeichen getrennt wird.
Ich bin über jeden hilfreichen Vorschlag dankbar.
Gruß
stamps
Kommentar