a518766bfe772497bc97ae18e9ffa2a48c61502e
[src/app-framework-binder.git] / src / jobs.c
1 /*
2  * Copyright (C) 2016-2019 "IoT.bzh"
3  * Author José Bollo <jose.bollo@iot.bzh>
4  *
5  * Licensed under the Apache License, Version 2.0 (the "License");
6  * you may not use this file except in compliance with the License.
7  * You may obtain a copy of the License at
8  *
9  *   http://www.apache.org/licenses/LICENSE-2.0
10  *
11  * Unless required by applicable law or agreed to in writing, software
12  * distributed under the License is distributed on an "AS IS" BASIS,
13  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
14  * See the License for the specific language governing permissions and
15  * limitations under the License.
16  */
17
18 #define _GNU_SOURCE
19
20 #include <stdlib.h>
21 #include <stdint.h>
22 #include <unistd.h>
23 #include <signal.h>
24 #include <string.h>
25 #include <time.h>
26 #include <sys/syscall.h>
27 #include <pthread.h>
28 #include <errno.h>
29 #include <assert.h>
30 #include <sys/eventfd.h>
31
32 #include <systemd/sd-event.h>
33
34 #include "jobs.h"
35 #include "evmgr.h"
36 #include "sig-monitor.h"
37 #include "verbose.h"
38 #include "systemd.h"
39
40 #define EVENT_TIMEOUT_TOP       ((uint64_t)-1)
41 #define EVENT_TIMEOUT_CHILD     ((uint64_t)10000)
42
43 struct thread;
44
45 /** Internal shortcut for callback */
46 typedef void (*job_cb_t)(int, void*);
47
48 /** Description of a pending job */
49 struct job
50 {
51         struct job *next;    /**< link to the next job enqueued */
52         const void *group;   /**< group of the request */
53         job_cb_t callback;   /**< processing callback */
54         void *arg;           /**< argument */
55         int timeout;         /**< timeout in second for processing the request */
56         unsigned blocked: 1; /**< is an other request blocking this one ? */
57         unsigned dropped: 1; /**< is removed ? */
58 };
59
60 /** Description of threads */
61 struct thread
62 {
63         struct thread *next;   /**< next thread of the list */
64         struct thread *upper;  /**< upper same thread */
65         struct thread *nholder;/**< next holder for evloop */
66         pthread_cond_t *cwhold;/**< condition wait for holding */
67         struct job *job;       /**< currently processed job */
68         pthread_t tid;         /**< the thread id */
69         volatile unsigned stop: 1;      /**< stop requested */
70         volatile unsigned waits: 1;     /**< is waiting? */
71         volatile unsigned leaved: 1;    /**< was leaved? */
72 };
73
74 /**
75  * Description of synchronous callback
76  */
77 struct sync
78 {
79         struct thread thread;   /**< thread loop data */
80         union {
81                 void (*callback)(int, void*);   /**< the synchronous callback */
82                 void (*enter)(int signum, void *closure, struct jobloop *jobloop);
83                                 /**< the entering synchronous routine */
84         };
85         void *arg;              /**< the argument of the callback */
86 };
87
88 /* synchronisation of threads */
89 static pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
90 static pthread_cond_t  cond = PTHREAD_COND_INITIALIZER;
91
92 /* count allowed, started and running threads */
93 static int allowed = 0; /** allowed count of threads */
94 static int started = 0; /** started count of threads */
95 static int running = 0; /** running count of threads */
96 static int remains = 0; /** allowed count of waiting jobs */
97
98 /* list of threads */
99 static struct thread *threads;
100 static _Thread_local struct thread *current_thread;
101
102 /* queue of pending jobs */
103 static struct job *first_job;
104 static struct job *free_jobs;
105
106 /* event loop */
107 static struct evmgr *evmgr;
108
109 static void (*exit_handler)();
110
111 /**
112  * Create a new job with the given parameters
113  * @param group    the group of the job
114  * @param timeout  the timeout of the job (0 if none)
115  * @param callback the function that achieves the job
116  * @param arg      the argument of the callback
117  * @return the created job unblock or NULL when no more memory
118  */
119 static struct job *job_create(
120                 const void *group,
121                 int timeout,
122                 job_cb_t callback,
123                 void *arg)
124 {
125         struct job *job;
126
127         /* try recyle existing job */
128         job = free_jobs;
129         if (job)
130                 free_jobs = job->next;
131         else {
132                 /* allocation without blocking */
133                 pthread_mutex_unlock(&mutex);
134                 job = malloc(sizeof *job);
135                 pthread_mutex_lock(&mutex);
136                 if (!job) {
137                         ERROR("out of memory");
138                         errno = ENOMEM;
139                         goto end;
140                 }
141         }
142         /* initialises the job */
143         job->group = group;
144         job->timeout = timeout;
145         job->callback = callback;
146         job->arg = arg;
147         job->blocked = 0;
148         job->dropped = 0;
149 end:
150         return job;
151 }
152
153 /**
154  * Adds 'job' at the end of the list of jobs, marking it
155  * as blocked if an other job with the same group is pending.
156  * @param job the job to add
157  */
158 static void job_add(struct job *job)
159 {
160         const void *group;
161         struct job *ijob, **pjob;
162
163         /* prepare to add */
164         group = job->group;
165         job->next = NULL;
166
167         /* search end and blockers */
168         pjob = &first_job;
169         ijob = first_job;
170         while (ijob) {
171                 if (group && ijob->group == group)
172                         job->blocked = 1;
173                 pjob = &ijob->next;
174                 ijob = ijob->next;
175         }
176
177         /* queue the jobs */
178         *pjob = job;
179         remains--;
180 }
181
182 /**
183  * Get the next job to process or NULL if none.
184  * @return the first job that isn't blocked or NULL
185  */
186 static inline struct job *job_get()
187 {
188         struct job *job = first_job;
189         while (job && job->blocked)
190                 job = job->next;
191         if (job)
192                 remains++;
193         return job;
194 }
195
196 /**
197  * Releases the processed 'job': removes it
198  * from the list of jobs and unblock the first
199  * pending job of the same group if any.
200  * @param job the job to release
201  */
202 static inline void job_release(struct job *job)
203 {
204         struct job *ijob, **pjob;
205         const void *group;
206
207         /* first unqueue the job */
208         pjob = &first_job;
209         ijob = first_job;
210         while (ijob != job) {
211                 pjob = &ijob->next;
212                 ijob = ijob->next;
213         }
214         *pjob = job->next;
215
216         /* then unblock jobs of the same group */
217         group = job->group;
218         if (group) {
219                 ijob = job->next;
220                 while (ijob && ijob->group != group)
221                         ijob = ijob->next;
222                 if (ijob)
223                         ijob->blocked = 0;
224         }
225
226         /* recycle the job */
227         job->next = free_jobs;
228         free_jobs = job;
229 }
230
231 /**
232  * Monitored cancel callback for a job.
233  * This function is called by the monitor
234  * to cancel the job when the safe environment
235  * is set.
236  * @param signum 0 on normal flow or the number
237  *               of the signal that interrupted the normal
238  *               flow, isn't used
239  * @param arg    the job to run
240  */
241 __attribute__((unused))
242 static void job_cancel(int signum, void *arg)
243 {
244         struct job *job = arg;
245         job->callback(SIGABRT, job->arg);
246 }
247
248 /**
249  * wakeup the event loop if needed by sending
250  * an event.
251  */
252 static void evloop_wakeup()
253 {
254         if (evmgr)
255                 evmgr_wakeup(evmgr);
256 }
257
258 /**
259  * Release the currently held event loop
260  */
261 static void evloop_release()
262 {
263         struct thread *nh, *ct = current_thread;
264
265         if (ct && evmgr && evmgr_release_if(evmgr, ct)) {
266                 nh = ct->nholder;
267                 ct->nholder = 0;
268                 if (nh) {
269                         evmgr_try_hold(evmgr, nh);
270                         pthread_cond_signal(nh->cwhold);
271                 }
272         }
273 }
274
275 /**
276  * get the eventloop for the current thread
277  */
278 static int evloop_get()
279 {
280         return evmgr && evmgr_try_hold(evmgr, current_thread);
281 }
282
283 /**
284  * acquire the eventloop for the current thread
285  */
286 static void evloop_acquire()
287 {
288         struct thread *pwait, *ct;
289         pthread_cond_t cond;
290
291         /* try to get the evloop */
292         if (!evloop_get()) {
293                 /* failed, init waiting state */
294                 ct = current_thread;
295                 ct->nholder = NULL;
296                 ct->cwhold = &cond;
297                 pthread_cond_init(&cond, NULL);
298
299                 /* queue current thread in holder list */
300                 pwait = evmgr_holder(evmgr);
301                 while (pwait->nholder)
302                         pwait = pwait->nholder;
303                 pwait->nholder = ct;
304
305                 /* wake up the evloop */
306                 evloop_wakeup();
307
308                 /* wait to acquire the evloop */
309                 pthread_cond_wait(&cond, &mutex);
310                 pthread_cond_destroy(&cond);
311         }
312 }
313
314 /**
315  * Enter the thread
316  * @param me the description of the thread to enter
317  */
318 static void thread_enter(volatile struct thread *me)
319 {
320         evloop_release();
321         /* initialize description of itself and link it in the list */
322         me->tid = pthread_self();
323         me->stop = 0;
324         me->waits = 0;
325         me->leaved = 0;
326         me->nholder = 0;
327         me->upper = current_thread;
328         me->next = threads;
329         threads = (struct thread*)me;
330         current_thread = (struct thread*)me;
331 }
332
333 /**
334  * leave the thread
335  * @param me the description of the thread to leave
336  */
337 static void thread_leave()
338 {
339         struct thread **prv, *me;
340
341         /* unlink the current thread and cleanup */
342         me = current_thread;
343         prv = &threads;
344         while (*prv != me)
345                 prv = &(*prv)->next;
346         *prv = me->next;
347
348         current_thread = me->upper;
349 }
350
351 /**
352  * Main processing loop of internal threads with processing jobs.
353  * The loop must be called with the mutex locked
354  * and it returns with the mutex locked.
355  * @param me the description of the thread to use
356  * TODO: how are timeout handled when reentering?
357  */
358 static void thread_run_internal(volatile struct thread *me)
359 {
360         struct job *job;
361
362         /* enter thread */
363         thread_enter(me);
364
365         /* loop until stopped */
366         while (!me->stop) {
367                 /* release the current event loop */
368                 evloop_release();
369
370                 /* get a job */
371                 job = job_get();
372                 if (job) {
373                         /* prepare running the job */
374                         job->blocked = 1; /* mark job as blocked */
375                         me->job = job; /* record the job (only for terminate) */
376
377                         /* run the job */
378                         pthread_mutex_unlock(&mutex);
379                         sig_monitor(job->timeout, job->callback, job->arg);
380                         pthread_mutex_lock(&mutex);
381
382                         /* release the run job */
383                         job_release(job);
384                 /* no job, check event loop wait */
385                 } else if (evloop_get()) {
386                         if (!evmgr_can_run(evmgr)) {
387                                 /* busy ? */
388                                 CRITICAL("Can't enter dispatch while in dispatch!");
389                                 abort();
390                         }
391                         /* run the events */
392                         evmgr_prepare_run(evmgr);
393                         pthread_mutex_unlock(&mutex);
394                         sig_monitor(0, (void(*)(int,void*))evmgr_job_run, evmgr);
395                         pthread_mutex_lock(&mutex);
396                 } else {
397                         /* no job and no event loop */
398                         running--;
399                         if (!running)
400                                 ERROR("Entering job deep sleep! Check your bindings.");
401                         me->waits = 1;
402                         pthread_cond_wait(&cond, &mutex);
403                         me->waits = 0;
404                         running++;
405                 }
406         }
407         /* cleanup */
408         evloop_release();
409         thread_leave();
410 }
411
412 /**
413  * Main processing loop of external threads.
414  * The loop must be called with the mutex locked
415  * and it returns with the mutex locked.
416  * @param me the description of the thread to use
417  */
418 static void thread_run_external(volatile struct thread *me)
419 {
420         /* enter thread */
421         thread_enter(me);
422
423         /* loop until stopped */
424         me->waits = 1;
425         while (!me->stop)
426                 pthread_cond_wait(&cond, &mutex);
427         me->waits = 0;
428         thread_leave();
429 }
430
431 /**
432  * Root for created threads.
433  */
434 static void thread_main()
435 {
436         struct thread me;
437
438         running++;
439         started++;
440         sig_monitor_init_timeouts();
441         thread_run_internal(&me);
442         sig_monitor_clean_timeouts();
443         started--;
444         running--;
445 }
446
447 /**
448  * Entry point for created threads.
449  * @param data not used
450  * @return NULL
451  */
452 static void *thread_starter(void *data)
453 {
454         pthread_mutex_lock(&mutex);
455         thread_main();
456         pthread_mutex_unlock(&mutex);
457         return NULL;
458 }
459
460 /**
461  * Starts a new thread
462  * @return 0 in case of success or -1 in case of error
463  */
464 static int start_one_thread()
465 {
466         pthread_t tid;
467         int rc;
468
469         rc = pthread_create(&tid, NULL, thread_starter, NULL);
470         if (rc != 0) {
471                 /* errno = rc; */
472                 WARNING("not able to start thread: %m");
473                 rc = -1;
474         }
475         return rc;
476 }
477
478 /**
479  * Queues a new asynchronous job represented by 'callback' and 'arg'
480  * for the 'group' and the 'timeout'.
481  * Jobs are queued FIFO and are possibly executed in parallel
482  * concurrently except for job of the same group that are
483  * executed sequentially in FIFO order.
484  * @param group    The group of the job or NULL when no group.
485  * @param timeout  The maximum execution time in seconds of the job
486  *                 or 0 for unlimited time.
487  * @param callback The function to execute for achieving the job.
488  *                 Its first parameter is either 0 on normal flow
489  *                 or the signal number that broke the normal flow.
490  *                 The remaining parameter is the parameter 'arg1'
491  *                 given here.
492  * @param arg      The second argument for 'callback'
493  * @param start    Allow to start a thread if not zero
494  * @return 0 in case of success or -1 in case of error
495  */
496 static int queue_job(
497                 const void *group,
498                 int timeout,
499                 void (*callback)(int, void*),
500                 void *arg,
501                 int start)
502 {
503         struct job *job;
504         int rc;
505
506         pthread_mutex_lock(&mutex);
507
508         /* allocates the job */
509         job = job_create(group, timeout, callback, arg);
510         if (!job)
511                 goto error;
512
513         /* check availability */
514         if (remains <= 0) {
515                 ERROR("can't process job with threads: too many jobs");
516                 errno = EBUSY;
517                 goto error2;
518         }
519
520         /* start a thread if needed */
521         if (start && running == started && started < allowed) {
522                 /* all threads are busy and a new can be started */
523                 rc = start_one_thread();
524                 if (rc < 0 && started == 0) {
525                         ERROR("can't start initial thread: %m");
526                         goto error2;
527                 }
528         }
529
530         /* queues the job */
531         job_add(job);
532
533         /* signal an existing job */
534         pthread_cond_signal(&cond);
535         pthread_mutex_unlock(&mutex);
536         return 0;
537
538 error2:
539         job->next = free_jobs;
540         free_jobs = job;
541 error:
542         pthread_mutex_unlock(&mutex);
543         return -1;
544 }
545
546 /**
547  * Queues a new asynchronous job represented by 'callback' and 'arg'
548  * for the 'group' and the 'timeout'.
549  * Jobs are queued FIFO and are possibly executed in parallel
550  * concurrently except for job of the same group that are
551  * executed sequentially in FIFO order.
552  * @param group    The group of the job or NULL when no group.
553  * @param timeout  The maximum execution time in seconds of the job
554  *                 or 0 for unlimited time.
555  * @param callback The function to execute for achieving the job.
556  *                 Its first parameter is either 0 on normal flow
557  *                 or the signal number that broke the normal flow.
558  *                 The remaining parameter is the parameter 'arg1'
559  *                 given here.
560  * @param arg      The second argument for 'callback'
561  * @return 0 in case of success or -1 in case of error
562  */
563 int jobs_queue(
564                 const void *group,
565                 int timeout,
566                 void (*callback)(int, void*),
567                 void *arg)
568 {
569         return queue_job(group, timeout, callback, arg, 1);
570 }
571
572 /**
573  * Internal helper function for 'jobs_enter'.
574  * @see jobs_enter, jobs_leave
575  */
576 static void enter_cb(int signum, void *closure)
577 {
578         struct sync *sync = closure;
579         sync->enter(signum, sync->arg, (void*)&sync->thread);
580 }
581
582 /**
583  * Internal helper function for 'jobs_call'.
584  * @see jobs_call
585  */
586 static void call_cb(int signum, void *closure)
587 {
588         struct sync *sync = closure;
589         sync->callback(signum, sync->arg);
590         jobs_leave((void*)&sync->thread);
591 }
592
593 /**
594  * Internal helper for synchronous jobs. It enters
595  * a new thread loop for evaluating the given job
596  * as recorded by the couple 'sync_cb' and 'sync'.
597  * @see jobs_call, jobs_enter, jobs_leave
598  */
599 static int do_sync(
600                 const void *group,
601                 int timeout,
602                 void (*sync_cb)(int signum, void *closure),
603                 struct sync *sync
604 )
605 {
606         struct job *job;
607
608         pthread_mutex_lock(&mutex);
609
610         /* allocates the job */
611         job = job_create(group, timeout, sync_cb, sync);
612         if (!job) {
613                 pthread_mutex_unlock(&mutex);
614                 return -1;
615         }
616
617         /* queues the job */
618         job_add(job);
619
620         /* run until stopped */
621         if (current_thread)
622                 thread_run_internal(&sync->thread);
623         else
624                 thread_run_external(&sync->thread);
625         pthread_mutex_unlock(&mutex);
626         if (sync->thread.leaved)
627                 return 0;
628         errno = EINTR;
629         return -1;
630 }
631
632 /**
633  * Enter a synchronisation point: activates the job given by 'callback'
634  * and 'closure' using 'group' and 'timeout' to control sequencing and
635  * execution time.
636  * @param group the group for sequencing jobs
637  * @param timeout the time in seconds allocated to the job
638  * @param callback the callback that will handle the job.
639  *                 it receives 3 parameters: 'signum' that will be 0
640  *                 on normal flow or the catched signal number in case
641  *                 of interrupted flow, the context 'closure' as given and
642  *                 a 'jobloop' reference that must be used when the job is
643  *                 terminated to unlock the current execution flow.
644  * @param closure the argument to the callback
645  * @return 0 on success or -1 in case of error
646  */
647 int jobs_enter(
648                 const void *group,
649                 int timeout,
650                 void (*callback)(int signum, void *closure, struct jobloop *jobloop),
651                 void *closure
652 )
653 {
654         struct sync sync;
655
656         sync.enter = callback;
657         sync.arg = closure;
658         return do_sync(group, timeout, enter_cb, &sync);
659 }
660
661 /**
662  * Unlocks the execution flow designed by 'jobloop'.
663  * @param jobloop indication of the flow to unlock
664  * @return 0 in case of success of -1 on error
665  */
666 int jobs_leave(struct jobloop *jobloop)
667 {
668         struct thread *t;
669
670         pthread_mutex_lock(&mutex);
671         t = threads;
672         while (t && t != (struct thread*)jobloop)
673                 t = t->next;
674         if (!t) {
675                 errno = EINVAL;
676         } else {
677                 t->leaved = 1;
678                 t->stop = 1;
679                 if (t->waits)
680                         pthread_cond_broadcast(&cond);
681                 else
682                         evloop_wakeup();
683         }
684         pthread_mutex_unlock(&mutex);
685         return -!t;
686 }
687
688 /**
689  * Calls synchronously the job represented by 'callback' and 'arg1'
690  * for the 'group' and the 'timeout' and waits for its completion.
691  * @param group    The group of the job or NULL when no group.
692  * @param timeout  The maximum execution time in seconds of the job
693  *                 or 0 for unlimited time.
694  * @param callback The function to execute for achieving the job.
695  *                 Its first parameter is either 0 on normal flow
696  *                 or the signal number that broke the normal flow.
697  *                 The remaining parameter is the parameter 'arg1'
698  *                 given here.
699  * @param arg      The second argument for 'callback'
700  * @return 0 in case of success or -1 in case of error
701  */
702 int jobs_call(
703                 const void *group,
704                 int timeout,
705                 void (*callback)(int, void*),
706                 void *arg)
707 {
708         struct sync sync;
709
710         sync.callback = callback;
711         sync.arg = arg;
712
713         return do_sync(group, timeout, call_cb, &sync);
714 }
715
716 /**
717  * Ensure that the current running thread can control the event loop.
718  */
719 void jobs_acquire_event_manager()
720 {
721         struct thread lt;
722
723         /* ensure an existing thread environment */
724         if (!current_thread) {
725                 memset(&lt, 0, sizeof lt);
726                 current_thread = &lt;
727         }
728
729         /* lock */
730         pthread_mutex_lock(&mutex);
731
732         /* creates the evloop on need */
733         if (!evmgr)
734                 evmgr_create(&evmgr);
735
736         /* acquire the event loop under lock */
737         if (evmgr)
738                 evloop_acquire();
739
740         /* unlock */
741         pthread_mutex_unlock(&mutex);
742
743         /* release the faked thread environment if needed */
744         if (current_thread == &lt) {
745                 /*
746                  * Releasing it is needed because there is no way to guess
747                  * when it has to be released really. But here is where it is
748                  * hazardous: if the caller modifies the eventloop when it
749                  * is waiting, there is no way to make the change effective.
750                  * A workaround to achieve that goal is for the caller to
751                  * require the event loop a second time after having modified it.
752                  */
753                 NOTICE("Requiring event manager/loop from outside of binder's callback is hazardous!");
754                 if (verbose_wants(Log_Level_Info))
755                         sig_monitor_dumpstack();
756                 evloop_release();
757                 current_thread = NULL;
758         }
759 }
760
761 /**
762  * Enter the jobs processing loop.
763  * @param allowed_count Maximum count of thread for jobs including this one
764  * @param start_count   Count of thread to start now, must be lower.
765  * @param waiter_count  Maximum count of jobs that can be waiting.
766  * @param start         The start routine to activate (can't be NULL)
767  * @return 0 in case of success or -1 in case of error.
768  */
769 int jobs_start(int allowed_count, int start_count, int waiter_count, void (*start)(int signum, void* arg), void *arg)
770 {
771         int rc, launched;
772         struct job *job;
773
774         assert(allowed_count >= 1);
775         assert(start_count >= 0);
776         assert(waiter_count > 0);
777         assert(start_count <= allowed_count);
778
779         rc = -1;
780         pthread_mutex_lock(&mutex);
781
782         /* check whether already running */
783         if (current_thread || allowed) {
784                 ERROR("thread already started");
785                 errno = EINVAL;
786                 goto error;
787         }
788
789         /* records the allowed count */
790         allowed = allowed_count;
791         started = 0;
792         running = 0;
793         remains = waiter_count;
794
795         /* start at least one thread: the current one */
796         launched = 1;
797         while (launched < start_count) {
798                 if (start_one_thread() != 0) {
799                         ERROR("Not all threads can be started");
800                         goto error;
801                 }
802                 launched++;
803         }
804
805         /* queue the start job */
806         job = job_create(NULL, 0, start, arg);
807         if (!job)
808                 goto error;
809         job_add(job);
810
811         /* run until end */
812         thread_main();
813         rc = 0;
814 error:
815         pthread_mutex_unlock(&mutex);
816         if (exit_handler)
817                 exit_handler();
818         return rc;
819 }
820
821 /**
822  * Exit jobs threads and call handler if not NULL.
823  */
824 void jobs_exit(void (*handler)())
825 {
826         struct thread *t;
827
828         /* request all threads to stop */
829         pthread_mutex_lock(&mutex);
830
831         /* set the handler */
832         exit_handler = handler;
833
834         /* stops the threads */
835         t = threads;
836         while (t) {
837                 t->stop = 1;
838                 t = t->next;
839         }
840
841         /* wait the threads */
842         pthread_cond_broadcast(&cond);
843
844         /* leave */
845         pthread_mutex_unlock(&mutex);
846 }